米OpenAIが5月に発表した生成AIモデル「GPT-4o」。テキストだけでなく音声や画像も扱えるマルチモーダルモデルとして、その特徴が注目を集めている。GPT-4oは従来のLLMと何が違うのか、そもそもマルチモーダルとは何を意味するのか。AIの専門家に解説してもらった。
GPT-4oは従来のLLMと何が違うのか、そもそもマルチモーダルとは何を意味するのか。さらに、GPT-4oを含む現在のマルチモーダルLLMの限界と今後の発展の方向性について、AIの専門家に解説してもらった。米国州立テキサス大学理学部卒業後、ボストンコンサルティンググループに参画。消費財や流通など多数のプロジェクトに参画した後、社内のデジタル部門の立ち上げに従事。その後、東大発AI系のスタートアップ企業に創業4人目のメンバーとして参画。AI事業部の立ち上げをリード。東京大学工学系研究科松尾豊研究室にて「産学連携の取り組み」「データサイエンス領域の教育」「企業連携の仕組みづくり」に従事。同時に東大発AIスタートアップの創業に参画。2016年にLaboro.
マルチモーダルが重要なのは、人間をはじめ高等生物は皆マルチモーダルだからです。複雑な世界をより正確に認識し適切なアクションを取る高度な知能には、複数の種類の感覚インプットを組み合わせて処理することが必要・有効だからです
South Africa Latest News, South Africa Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
TOKIUM、GPT-4oを搭載した契約管理クラウド「TOKIUM契約管理」--検索性を向上TOKIUMは5月29日、電子および紙の契約書をクラウド上で一元管理できる契約管理クラウド「TOKIUM契約管理」を、6月3日から新たに提供を開始すると発表。このサービスは、契約書に記載されている取引先名や契約期間などの契約内容を、GPT-4oが自動で抽出し、データ化するというものとなっている。
Read more »
マネーフォワード、「GPT-4o」を活用し契約書をAI-OCRで読み取る「AI自動入力機能」マネーフォワードは5月29日、電子契約・契約書管理サービス「マネーフォワード クラウド契約」において、契約書の情報をAI-OCRで読み取り、管理項目を自動入力する「AI自動入力機能」のβ版の提供を開始した。この機能には、OpenAIが2024年5月に発表した最新AIモデル「GPT-4o」を使用している。
Read more »
GPT-4o搭載、契約書の検索性を向上する「TOKIUM契約管理」を提供開始GPT-4o搭載、契約書の検索性を向上する「TOKIUM契約管理」を提供開始 株式会社TOKIUMのプレスリリース
Read more »
「教育用ChatGPT」登場 企業向けより安く提供OpenAIは5月30日、大学向けに設計された「ChatGPT Edu」を発表。「GPT-4o」をベースにテキストと画像を処理、データ分析などの高度なツールも利用可能にも関わらず手頃な価格設定となっている
Read more »
アップルの新製品とOpenAIが目指す先:2024年5月に最も読まれた10本のストーリーこの5月に「WIRED.jp」で公開した記事のなかから、アップルの新製品やOpenAIの最新AIモデル「GPT-4o」に関する話題など、最も読まれた10本のストーリーを紹介する。
Read more »
英会話メタバース『fondi』、最新の生成AI「GPT-4o」が搭載された、海外留学エージェント『スマ留』のメタバースキャンパスを設立英会話メタバース『fondi』、最新の生成AI「GPT-4o」が搭載された、海外留学エージェント『スマ留』のメタバースキャンパスを設立 株式会社fondiのプレスリリース
Read more »