テクノロジー

Meta、無料で商用可能なLLM「Llama 3.2」リリース マルチモーダルモデルも

2024-09-25

著者:

アメリカのMetaは9月25日(現地時間)、年次開発者会議「Meta Connect 2024」において、同社のLLM「Llama」の最新バージョン「Llama 3.2」のリリースを発表しました。7月には「Llama 3.1」がリリースされたばかりですが、今回は大幅なアップデートとなっています。

このアップデートには、主に中小規模のビジョンLLMが追加されており、従来のテキスト生成に加えて、豊富なマルチモーダル機能が強化されています。具体的には、Llama 3.2では11B(110億)と90B(900億)の2つのモデルが利用可能で、画像認識機能が搭載されています。

新機能としては、画像の内容に基づいた解説生成や、画像のキャプション生成が可能であり、さらに画像に対するオブジェクト認識を用いた視覚的な解釈が強化されています。たとえば、ユーザーが前年のどの月に写真を投稿したかを時間の経過に沿って正確に回答する能力が向上しています。

エッジデバイスにおける軽量モデルも提供されており、1Bから3Bの軽量モデルは、必要条件や指示の追加、書き換えタスクに最適化された実装として最適化が進められています。これにより、128Kトークンのコンテキスト長をサポートし、軽快なパフォーマンスを実現しています。これらのモデルは、QualcommやMediaTekのハードウェアを利用して動作し、Armプロセッサ向けに最適化されています。

開発者たちは、データから離れることのない、プライバシーを重視したアプリケーションの構築ができるようになります。たとえば、受信した最新の10件のメッセージを要約したり、アクションアイテムを抽出したりする機能が可能になるでしょう。

多様な環境でのモデルを活用するためのツールセット「Llama Stack」も提供されており、開発者はシンプルにLlamaモデルを利用できるようになります。これにより、検索固有生成(RAG)や安全性が統合されたツール対応アプリにすぐに展開できるようになっています。

Llama 3.2は、llama.comやHugging Faceを通じて導入可能です。また、AMD、AWS、Databricks、Dell、Google Cloud、Groq、IBM、Intel、Microsoft Azure、NVIDIA、Oracle Cloud、Snowflakeなどのパートナー企業との幅広い幅広いエコシステムにより、開発が行いやすくなっています。今後、企業はこれらのモデルを利用して、さらに革新的なアプリケーションを開発していくことでしょう。最新技術の波に乗り遅れないために、あなたもLlama 3.2をチェックすべきです!