LLM(大規模言語モデル)が注目されていますが、その先駆けとなったNTTが開発した「tsuzumi」は、高い日本語処理能力と軽量性、柔軟なカスタマイズ性が特徴です。このブログでは、「tsuzumi」の概要、特徴、性能の理由、アダプタを使ったカスタマイズ性などについて詳しく解説します。企業における言語AIの活用にご関心のある方は、ぜひお読みください。
1. NTTが開発した「tsuzumi」とは
「tsuzumi」とは、NTT(日本電信電話)が開発した大規模言語モデル(LLM)の一つです。2023年11月に発表され、商用提供も始まりました。
軽量化したモデル
tsuzumiは、パラメーター数を大幅に軽量化しています。そのため、OpenAIの「GPT-3」と比べても約25分の1のパラメーター数で動作します。この軽量化により、1つのGPUで動作可能であり、大規模なハードウェアを必要とせず、事務所内でのオンプレミス利用も可能です。
優れた日本語処理能力
tsuzumiは、「世界トップレベルの日本語処理能力」を有しています。パラメーターを軽量化したにもかかわらず、GPT-3.5と比較した場合でも、8割以上の勝率を達成しています。また、英語においても高い処理能力を持ち、さらにマルチモーダルな機能も備えています。パワーポイントの図表読解や聴覚への対応も可能です。
高いカスタマイズ性
tsuzumiは、企業向けのLLMとして開発されており、導入する企業が独自にカスタマイズして利用することができます。これにより、様々な業界や企業に特化したLLMを低コストで構築することが可能です。
クローズドな環境での運用
tsuzumiはオンプレミス環境で動作するため、機密性の高い情報を学習し、LLMをカスタマイズすることができます。このクローズドな環境での運用は、セキュリティ上の要件を満たすために重要です。
以上がNTTが開発した「tsuzumi」の概要と特徴です。軽量化されたモデルでありながら高い言語処理能力を持ち、さらにカスタマイズ性も高いため、多くの企業や団体に注目されています。次に、「tsuzumi」の特徴と強みについて詳しく見ていきましょう。
2. 「tsuzumi」の特徴と強み
「tsuzumi」は、NTTが開発した大規模言語モデル(LLM)であり、以下の特徴と強みを持っています。
高い言語処理能力と日本語の特化性
・ NTT研究所の40年以上にわたる自然言語処理のノウハウを活かしており、日本語において優れた回答性能を持っています。
・ 日本語の回答精度は世界トップクラスであり、パラメータサイズが小さくても高い精度を実現します。
軽量なパラメータサイズとコストパフォーマンス
・ 「tsuzumi」は軽量なモデルであり、パラメータサイズが小さいため、学習と推論のコストを抑えることができます。
・ 特に超軽量版の「tsuzumi-0.6B」は、CPUでの実行が可能であり、GPUのコストも低くなっています。
・ NTTは効率的な利用とコストパフォーマンスを重視しています。
高いカスタマイズ性と柔軟性
・ 「tsuzumi」は業界や企業のリソース、用途に合わせてカスタマイズすることが可能です。
・ アダプタを導入することで、特定の業界に固有の言語表現や知識に対応するチューニングを追加学習を少なくして行えます。
・ テキストだけでなく、図表や請求書などのドキュメントの読解にも対応し、マルチモーダルな処理も可能です。
安全性の確保と豊富なアセットの活用
・ 「tsuzumi」の利用には、NTTグループの豊富なアセットを活用することができます。
・ NTTグループのデータセンターでのプライベートクラウド運用など、安全性と利便性の向上を提供します。
・ 企業内のデータを外部に出すことに抵抗感のある企業にも、セキュリティを確保しながら利用できるオプションがあります。
「tsuzumi」はこれらの特徴と強みによって、さまざまな業界やシーンで活用されることが期待されています。次のセクションでは、具体的な活用シーンとソリューションについて詳しく見ていきましょう。
3. 軽量でありながら高性能な理由
「tsuzumi」が軽量でありながら高性能な理由には、以下の要素があります。
3.1 モデルの軽量化
「tsuzumi」は、効果的にパラメータサイズを軽量化することにより、高性能を実現しています。GPT-3と比較して1/300サイズまたは1/25サイズに軽量化されています。さらに、軽量な1GPU版と超軽量なCPU版が提供されるため、推論を高速に実行し、電力量とコストを節約することができます。
3.2 NTT研究所のノウハウと研究力
NTT研究所は、40年以上にわたって自然言語処理の研究を行ってきた蓄積とノウハウを持っています。その研究力は世界トップクラスであり、国内外で高い評価を受けています。この研究力を活かして、「tsuzumi」は日本語と英語に対応し、小さなパラメータサイズでも高い精度を提供します。
3.3 柔軟なチューニングとアダプタの導入
「tsuzumi」では、利用ユーザーやシーンに応じたアダプタを導入することで、特定の業界固有の言語表現や知識に柔軟に対応することが可能です。追加学習の量を最小限に抑えながら、さまざまな業界の要件に高いカスタマイズ性を備えています。
3.4 マルチモーダルな対応予定
将来的には、「tsuzumi」はテキストだけでなく、プレゼンテーションスライドに含まれる図やグラフなどの視覚的な要素にも対応する予定です。これにより、画像付き文書の検索や視覚的な読解が必要な業務において、人間の認知能力を補完しながら、効率的な業務処理が可能になります。
これらの要素により、「tsuzumi」は軽量でありながら高性能な特徴を備えています。企業のニーズに合わせて効果的な課題解決や業務効率化を実現することができます。
4. アダプタによる柔軟なカスタマイズ
「tsuzumi」は、アダプタを使用することで柔軟なカスタマイズが可能です。アダプタは、モデルの振る舞いを特定のタスクや目的に合わせて調整するためのツールです。
アダプタの機能と役割
アダプタは、以下の機能と役割を持っています。
1. タスクの適合性向上
特定のタスクに特化した学習によって、モデルの応答の正確性を高めることができます。アダプタは、タスクに特化した知識や語彙を学習させることで、より適切な応答を作り出します。
2. ユーザや法的要件に合わせた制約の追加
アダプタは、ユーザや法的な要件に応じて、応答に制約を追加することができます。これにより、個々のユーザのニーズやプライバシーに対応することができます。
3. 特定ドメインや業界に特化した知識や語彙の獲得
特定のドメインや業界に関連した知識や語彙を学習させることができます。アダプタは、専門的な知識や用語をモデルに組み込むことで、そのドメインや業界に特化した応答を提供します。
4. 応答のスタイルやトーンの調整
アダプタを使用することで、応答のスタイルやトーンを特定の要件に合わせて調整することができます。例えば、フォーマルなスタイルやフレンドリーなトーンなど、ユーザに適した口調で応答することが可能です。
アダプタの利点
アダプタの使用には以下の利点があります。
1. 追加学習量の削減
アダプタを使用することで、新しい知識を追加学習する際の必要な学習量を削減することができます。これにより、学習コストを軽減することができます。
2. 業界特有の言語表現や知識に対応
アダプタを使用することで、特定の業界に特有の言語表現や知識に対応するためのチューニングを少ない学習量で実現することができます。これにより、異なる業界や専門知識を持つユーザにも適した応答を提供することができます。
2024年4月以降、新たに導入予定の「マルチアダプタ」機能を使用することで、複数のアダプタを柔軟に切り替えたり、組み合わせたりすることができます。また、マルチアダプタの導入により、個々の組織や役職・権限に応じた細やかなチューニングを低コストで提供することも可能となります。
「tsuzumi」のアダプタによる柔軟なカスタマイズは、ユーザや業界の要求に応じた高度なカスタマイズを実現します。
5. さまざまな活用シーンとソリューション
「tsuzumi」は、その高性能と柔軟性のため、様々な活用シーンで利用できます。以下では、tsuzumiのさまざまな活用シーンとそのソリューションについて説明します。
5.1 CX向上のための活用シーンとソリューション
デジタルヒューマン技術を活用した顧客応対ソリューション
「tsuzumi」を利用することで、デジタルヒューマン技術と組み合わせた「バーチャルコンシェルジュ」を導入することができます。これにより、顧客とのコミュニケーションを自然に行い、顧客の属性や要望に基づいた的確な応対が可能となります。
コールセンターの効率化ソリューション
「tsuzumi」は、コールセンターの業務効率化にも活用できます。オペレーターに対してリアルタイムで顧客への回答候補を提示し、顧客対応後の報告の要約を自動化することができます。これにより、迅速で正確な対応が可能となります。
5.2 EX向上のための活用シーンとソリューション
業界や業務に特化した従業員支援ソリューション
「tsuzumi」と業界特化LLMを組み合わせることで、各業界の業務プロセスに特化した従業員支援ソリューションを実現できます。例えば、議事録作成や要約、業務マニュアルの作成を効率化し、従業員の生産性向上に貢献することができます。
5.3 CRX向上のための活用シーンとソリューション
IT運用の自動化ソリューション
「tsuzumi」を活用することで、企業のIT部門の課題であるセキュリティ対応の自動化が可能となります。AIがマルウェアや攻撃の検知・分析・対処を行いながら、操作サポートやセキュリティレポートの生成、脆弱性診断などをサポートします。これにより、IT人材の負荷を軽減し、効率的なIT運用を実現できます。
5.4 その他の活用シーンとソリューション
以下は「tsuzumi」のその他の活用シーンとソリューションです。
- 教育: 生成AIを活用して教材や資料の作成を効率化し、教育の質を向上させることができます。
- ヘルスケア: 生成AIを活用して医療記録や患者への情報提供を効率化し、効率的な医療サービスを提供することができます。
- 建設現場: 設計図や施工マニュアルの作成を効率化し、建設現場の作業効率を向上させることができます。
- テレプレゼンス: 生成AIを活用してリモートコミュニケーションの品質向上や会議の効率化を実現することができます。
- GX(Green Transformation): 省エネやエネルギー効率の向上に生成AIを活用することで、環境問題への取り組みを支援します。
- HR-Tech: 生成AIを活用して採用活動や人事業務の効率化を図り、人材管理の品質向上を図ることができます。
以上が「tsuzumi」のさまざまな活用シーンとソリューションです。将来的には、さらなるアプリケーション領域の拡大が期待されており、需要に応じた様々なソリューションの提供が進められるでしょう。
まとめ
「tsuzumi」は、日本語処理能力が高く、軽量なモデルでありながら高性能な大規模言語モデル(LLM)です。NTTの長年の自然言語処理の研究成果を活かし、小さなリソースで高い精度を実現しています。特にアダプタを使ったカスタマイズ性の高さが魅力で、ユーザーや業界のニーズに合わせてモデルを最適化することができます。様々な活用シーンが期待されており、顧客体験の向上やIT運用の自動化など、企業の業務効率化に大きな貢献が期待されています。NTTの技術力と開発力に注目が集まるなか、「tsuzumi」は今後の展開が非常に楽しみな製品と言えるでしょう。