Appleの研究者らは、「LLMにおける数学的推論の限界を理解する」という論文を発表した。OpenAIのGPT-4oやo1-previewなどのLLMは、他のLLMと比べて高性能だが、真の推論には課題があるとしている。
例として、公衆電話からの通話料金に関する問題をベースに、問題の難易度を4段階に調整した結果の正解率を、米GoogleのGemma 2や米OpenAIのGPT-o1 mini、米MicrosoftのPhi-3.5で調べたところ、いずれのLLMも難易度が上がると正解率が下がった。電話ボックスから電話をかける場合、1分あたり0.6ドル掛かります。10分を超えると、料金は1分あたり0.5ドルに下がります。60分間の通話はいくらですか?
ホテルの部屋の電話から電話をかける場合、1分あたり0.6ドル掛かります。10分経過すると、料金は1分あたり0.5ドルに下がります。通話開始から25 分経過すると、料金はさらに下がり、1分あたり0.3ドルになります。60分間の通話はいくらですか? ホテルの電話から電話をかける場合、1分あたり0.6ドル掛かります。10分経過すると、料金は1分あたり0.5ドルに下がります。通話開始から25分経過すると、料金はさらに下がり、1分あたり0.3ドルになります。合計請求額が10ドルを超える場合は、25%割引になります。60分間の通話料金はいくらですか?キウイの数の問題(Image Credits:Mirzadeh et al)研究者らは、LLMの限界を克服できるかどうかについては明言していない。現在のLLMが真の数学的推論能力を獲得するには、パターン認識を超えた、より高度な推論能力の開発が必要であると結論付けている。特に、問題の本質を理解し、無関係な情報を適切に処理できる能力の向上が不可欠であると指摘する。
South Africa Latest News, South Africa Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
英語スピーキング特化型学習アプリ「スピーク」 OpenAIのGPT-4o API導入により、AIとのリアルタイム音声対話機能を提供開始英語スピーキング特化型学習アプリ「スピーク」 OpenAIのGPT-4o API導入により、AIとのリアルタイム音声対話機能を提供開始 Speakeasy Labs, Inc.のプレスリリース
Read more »
世界最強のオープンソース型AIモデル誕生の内側スタートアップのデータブリックスはメタのLlama 2やイーロン・マスクのGrok AIを凌ぎ、OpenAIのGPT-4に肉薄するオープンソース型の大規模言語モデル「DBRX」をリリースした。
Read more »
OpenAIのGPT-4はCVEのセキュリティ勧告を読むことで実際の脆弱性を悪用できることが明らかにOpenAIが開発する大規模言語モデル(LLM)のGPT-4は、一般公開されている脆弱(ぜいじゃく)性を悪用してサイバー攻撃を成功させることが可能であることが最新の研究により明らかになりました。
Read more »
無料でGPT-4! Bing AIチャットで業務効率をアップOpenAIのGPT-4をベースにしたBing AIチャットは、現在、1回のセッションでやりとりできる数が30回、1日合計で300回までやりとりできる。無料で利用できるのだから、活用しない手はない。
Read more »
OpenAIのGPT-4で、AIはついに汎用人工知能への第一歩を踏み出したのか新世代のAIアルゴリズムを使うと、汎用人工知能(AGI)についに到達したかに感じられることもしばしばだ。だがマイクロソフトの最高科学責任者や多くの科学者たちから発表される最新の論文からは、知能の定義や測定の難しさが浮き彫りとなっている。
Read more »
Anthropicのテキスト生成AI「Claude」がOpenAIのGPT-4の約3万2000トークンの3倍近い10万トークンに対応して長文の入力も可能にChatGPTなどの対話型AIは、高精度なテキストを生成できる一方、入力が可能な言語の最小単位である「トークン」には限度があります。OpenAIのGPT-4は約3万2000トークンまでの入力が可能ですが、AI研究スタートアップのAnthropicがテキスト生成AI「Claude」のトークンを9000から10万へ拡張したことを発表しました。
Read more »