AWS認定資格 無料問題集解答・解説
第17問 推論パフォーマンスを改善する適切なアプローチ
ある金融サービス企業は、大規模言語モデルを利用して、顧客からの問い合わせメールを自動分類して、緊急度に応じて担当部署へ振り分けるアプリケーションを構築しました。しかしながら、モデルの推論に時間がかかり、メール処理の遅延が発生しています。推論パフォーマンスを改善するために最も適切なアプローチを選択してください。
(問題ID:AIF202C017)
解答
正しい解答:A. モデルの最大生成トークン数を減少させる。
△ 判定不能 URL を直接入力して「解答・解説」画面を表示した場合、何を選択・解答したかを特定できないため、解答の正誤判定ができません。必要に応じて「同じ問題に再挑戦」ボタンをクリックして、この問題に再チャレンジしてみてください。
徹底解説
大規模言語モデル(LLM:Large Language Model)を利用したアプリケーションにおいて、推論パフォーマンスを改善する最も適切な方法は、「モデルの最大生成トークン数を減少させる」 ことです。トークン(Token)とは、テキストデータを処理する際の基本単位であり、単語やサブワードなどに分割されてモデルに入力、あるいは、モデルから出力されるものです。例えば、「生成AIは便利です。」 という文章は、「生成」 「AI」 「は」 「便利」 「です」 「。」 といった複数のトークンに分割されます。LLMでは、生成されるトークン数が多いほど計算量が増えて、推論に時間がかかります。逆に言うと、最大生成トークン数を減らすことで、モデルが応答を生成する出力の長さが短くなり、推論に必要となる計算量は減少します。その結果、処理遅延が改善されて、応答パフォーマンスの向上につなげることができます。なお、ここで示した例のように、短い文章でもトークン数が意外と多くなる点は、日本語処理の特徴のひとつと言えるかもしれません。
その他の選択肢のアプローチはいずれも不適切です。「モデルのTop-p値を増加させる」 ことについて、Top-pサンプリングは確率分布からトークンを確率の高い順に並べ、累積確率がpを超えるまでの集合を取り出し、その中からランダムに1つを選ぶ手法です。Top-pの値を変更することで、応答の多様性に影響することはありますが、推論パフォーマンスの改善には直接関係するものではありません。また、「モデルのストップシーケンスを削除する」 ことについて、ストップシーケンスは、生成を途中で打ち切るための条件であり、削除するとモデルがより長い出力を生成し続ける可能性が高まります。その結果、推論に必要な計算量が増えて、応答速度が低下する恐れがあるため、パフォーマンス改善には、むしろ逆効果です。そして、「モデルの温度パラメーターを減少させる」 ことについて、温度パラメーターは、LLMの推論時に使用される設定項目であり、モデルが次の語句や文を選ぶ際のランダム性や多様性(出力の幅)を制御するために使われます。応答内容の創造性を調整するパラメーターであるため、低くすることにより確定的な応答にするような調整はできますが、推論速度にはほとんど影響することはありません。
ちなみに...
LLMでは、トークン数を多くするほど計算リソースが必要となり、応答時間やコストは増加しますが、その一方で、より長い文脈を保持できるため、モデルが詳細で高品質な応答を生成しやすくなるというメリットもあります。ユースケースに応じて、必要な文脈量と推論速度のバランスを取ることが重要です。
問題掲載日:2026-05-16
Information
What's New
- 2026/6/14 問題ID: AIF203C021 大規模言語モデルのトレーニングに最適なインスタンスに関する問題を追加しました。
- 2026/6/6 問題ID: AIF301S004 透明性を重視した責任あるAIのガイドラインに関する問題を追加しました。
- 2026/5/30 問題ID: AIF301S003 ファインチューニングにかかるコストの削減方法に関する問題を追加しました。
- 2026/5/30 問題ID: AIF301S002 通話データを活用した要約・改善提案アプリケーションに関する問題を追加しました。
- 2026/5/30 問題ID: AIF301S001 機械学習の適用が適切なユースケースに関する問題を追加しました。
Reference Books
AWS認定 AIプラクティショナー 合格対策テキスト+問題集

図解も豊富でとても理解しやすく、試験の対策に必要な知識を効率よく学べる一冊です。AIの歴史経緯も説明されているところも面白い。テキストと問題集がセットになっており、基礎から実践まで無理なく進められます。ページ数も控えめで読みやすく、クラウドやAIの初心者でも安心して取り組める内容です。AWS認定 資格試験テキスト AWS認定AIプラクティショナー

AWS認定 AIプラクティショナー試験(AIF-C01)の“緑本”とも呼ばれる定番テキストです。AIや機械学習、生成AIなどの基礎知識を幅広く網羅しており、図解も豊富で初心者にもわかりやすい構成です。練習問題も充実しており、試験対策として安心して使える一冊です。さらに、当サイトの問題演習と組み合わせることで、効率的に知識を定着させることができます。
解答・解説
第17問 推論パフォーマンスを改善する適切なアプローチ
ある金融サービス企業は、大規模言語モデルを利用して、顧客からの問い合わせメールを自動分類して、緊急度に応じて担当部署へ振り分けるアプリケーションを構築しました。しかしながら、モデルの推論に時間がかかり、メール処理の遅延が発生しています。推論パフォーマンスを改善するために最も適切なアプローチを選択してください。
(問題ID:AIF202C017)
解答
正しい解答:A. モデルの最大生成トークン数を減少させる。
URL を直接入力して「解答・解説」画面を表示した場合、何を選択・解答したかを特定できないため、解答の正誤判定ができません。必要に応じて「同じ問題に再挑戦」ボタンをクリックして、この問題に再チャレンジしてみてください。
徹底解説
大規模言語モデル(LLM:Large Language Model)を利用したアプリケーションにおいて、推論パフォーマンスを改善する最も適切な方法は、「モデルの最大生成トークン数を減少させる」 ことです。トークン(Token)とは、テキストデータを処理する際の基本単位であり、単語やサブワードなどに分割されてモデルに入力、あるいは、モデルから出力されるものです。例えば、「生成AIは便利です。」 という文章は、「生成」 「AI」 「は」 「便利」 「です」 「。」 といった複数のトークンに分割されます。LLMでは、生成されるトークン数が多いほど計算量が増えて、推論に時間がかかります。逆に言うと、最大生成トークン数を減らすことで、モデルが応答を生成する出力の長さが短くなり、推論に必要となる計算量は減少します。その結果、処理遅延が改善されて、応答パフォーマンスの向上につなげることができます。なお、ここで示した例のように、短い文章でもトークン数が意外と多くなる点は、日本語処理の特徴のひとつと言えるかもしれません。
その他の選択肢のアプローチはいずれも不適切です。「モデルのTop-p値を増加させる」 ことについて、Top-pサンプリングは確率分布からトークンを確率の高い順に並べ、累積確率がpを超えるまでの集合を取り出し、その中からランダムに1つを選ぶ手法です。Top-pの値を変更することで、応答の多様性に影響することはありますが、推論パフォーマンスの改善には直接関係するものではありません。また、「モデルのストップシーケンスを削除する」 ことについて、ストップシーケンスは、生成を途中で打ち切るための条件であり、削除するとモデルがより長い出力を生成し続ける可能性が高まります。その結果、推論に必要な計算量が増えて、応答速度が低下する恐れがあるため、パフォーマンス改善には、むしろ逆効果です。そして、「モデルの温度パラメーターを減少させる」 ことについて、温度パラメーターは、LLMの推論時に使用される設定項目であり、モデルが次の語句や文を選ぶ際のランダム性や多様性(出力の幅)を制御するために使われます。応答内容の創造性を調整するパラメーターであるため、低くすることにより確定的な応答にするような調整はできますが、推論速度にはほとんど影響することはありません。
ちなみに...
LLMでは、トークン数を多くするほど計算リソースが必要となり、応答時間やコストは増加しますが、その一方で、より長い文脈を保持できるため、モデルが詳細で高品質な応答を生成しやすくなるというメリットもあります。ユースケースに応じて、必要な文脈量と推論速度のバランスを取ることが重要です。
問題掲載日:2026-05-16
Information
What's New
- 2026/6/14 問題ID: AIF203C021 大規模言語モデルのトレーニングに最適なインスタンスに関する問題を追加しました。
- 2026/6/6 問題ID: AIF301S004 透明性を重視した責任あるAIのガイドラインに関する問題を追加しました。
- 2026/5/30 問題ID: AIF301S003 ファインチューニングにかかるコストの削減方法に関する問題を追加しました。
- 2026/5/30 問題ID: AIF301S002 通話データを活用した要約・改善提案アプリケーションに関する問題を追加しました。
- 2026/5/30 問題ID: AIF301S001 機械学習の適用が適切なユースケースに関する問題を追加しました。
Reference Books
AWS認定 AIプラクティショナー 合格対策テキスト+問題集

図解も豊富でとても理解しやすく、試験の対策に必要な知識を効率よく学べる一冊です。AIの歴史経緯も説明されているところも面白い。テキストと問題集がセットになっており、基礎から実践まで無理なく進められます。ページ数も控えめで読みやすく、クラウドやAIの初心者でも安心して取り組める内容です。
AWS認定 資格試験テキスト AWS認定AIプラクティショナー

AWS認定 AIプラクティショナー試験(AIF-C01)の“緑本”とも呼ばれる定番テキストです。AIや機械学習、生成AIなどの基礎知識を幅広く網羅しており、図解も豊富で初心者にもわかりやすい構成です。練習問題も充実しており、試験対策として安心して使える一冊です。さらに、当サイトの問題演習と組み合わせることで、効率的に知識を定着させることができます。