ELYZAは大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Metaの「Llama 3」をベースとした700億パラメーターの「Llama-3-ELYZA-JP-70B」と80億パラメーターの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。
ELYZAは6月26日、同社が提供する大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Metaの「Llama 3」をベースとした700億パラメーターの「Llama-3-ELYZA-JP-70B」と80億パラメーターの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。
Llama-3-ELYZA-JP-70Bは、Llama-3-70Bをベースに追加の学習(日本語追加事前学習・指示学習)を実施して開発したモデル。元のLlama-3-70Bから大きく日本語性能を向上させており、日本語の性能を測定するための2つのベンチマークを用いた自動評価において、国内モデルの中では最高性能の水準を実現。「GPT-4」や「Claude 3 Sonnet」、「Gemini 1.5 Flash」と同等あるいは上回る性能を達成しているという。Llama-3-ELYZA-JP-8Bは、MetaのLlama-3-8Bをベースに事後学習(日本語追加事前学習・指示学習)を実施して開発したモデル。Llama-3-ELYZA-JP-70B同様に元のLlama-3-8Bから大きく日本語性能が向上しており、80億パラメーターの軽量なモデルながら日本語の性能を測定するための2つのベンチマークを用いた自動評価において、「GPT-3.5 Turbo」や「Claude 3 Haiku」、「Gemini 1.
South Africa Latest News, South Africa Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
ELYZA、「GPT-4」を上回る日本語性能のLLMを開発ELYZAは大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Metaの「Llama 3」をベースとした700億パラメーターの「Llama-3-ELYZA-JP-70B」と80億パラメーターの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。
Read more »
ELYZA、「GPT-4」を上回る日本語性能のLLMを開発ELYZAは大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Metaの「Llama 3」をベースとした700億パラメーターの「Llama-3-ELYZA-JP-70B」と80億パラメーターの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。
Read more »
“GPT-4超え性能”の日本語特化型LLM AIスタートアップ・ELYZAが開発 国外プレイヤーとの競争も「諦めない」(1/2 ページ)東大発のAIスタートアップ企業であるELYZAは、GPT-4を超える性能を持つ日本語特化型の大規模言語モデル(LLM)「Llama-3-ELYZA-JP-70B」を開発したと発表した。
Read more »
ELYZA、「GPT-4」を上回る性能の日本語LLMを開発・公開ELYZA、「GPT-4」を上回る性能の日本語LLMを開発・公開 株式会社ELYZAのプレスリリース
Read more »
OpenAIがGPT-4の思考を1600万個の解釈可能なパターンに分解できたと発表GPT-4などの大規模言語モデルは非常に高い性能を有していますが、各モデルがどのような思考を経て応答を出力しているのかは開発者ですら把握できていません。新たに、OpenAIが大規模言語モデルの思考を読み取る手法を開発し、GPT-4の思考を1600万個の解釈可能なパターンに分解できたことを発表しました。
Read more »
Microsoftが開始からわずか3カ月でCopilot Proの「GPT Builder」の一般提供の廃止を発表Microsoftは2024年3月に、Copilotに搭載されたAIチャット機能「Copilot GPT」をカスタマイズできるサービス「GPT Builder」の提供を、Copilot Proユーザー向けに開始しました。しかし、リリースからわずか3カ月後の6月10日に、Microsoftが個人向けのGPT Builderの提供を打ち切ることを発表しました。
Read more »