Espressif は、コネクテッドデバイスを LLM 体験の自然なインタラクションポイントへと変え、デバイス上で LLM を直接実行することなくその活用を可能にします。マルチモーダル入力の取得から、ローカルでのアクション実行、さらにファームウェア、クラウド、アプリの統合までをカバーする包括的な技術スタックにより、プライベート LLM エージェントソリューションの迅速な構築を支援します。
マルチモーダル統合ソリューション
音声、映像、テキスト、センサー入力を活用し、自然で安全、低遅延なスマートデバイス体験を実現します
マルチモーダル入力
音声
- ウェイクワード
- ノイズ低減
- エコーキャンセル
テキスト
- テキスト入力
- 内容理解
- 整理・分析
ビジュアル
- 画像補正
- 回転・クロップ
- フレーム応答
センサー
- 環境検知
- 状態認識
- 測位
- 測距
AI Agents
-
OpenAI
-
DeepSeek
-
Gemini
-
Doubao
-
Qwen
-
ERNIE
-
OpenAI
-
DeepSeek
-
Gemini
-
Doubao
-
Qwen
-
ERNIE
-
OpenAI
-
DeepSeek
-
Gemini
-
Doubao
-
Qwen
-
ERNIE
多様なシーンに広がる AI インタラクション
ホームコンパニオンから産業協働まで、多様なシナリオのインタラクション需要に ESP チップシリーズが対応します
- ホーム
- スマートスピーカー
- 教育
- 医療デバイス
- スマート農業灌漑
- ロボットアーム
伝送から処理まで、実装を加速
スムーズな音声・映像伝送
Espressif は WebRTC ストリーミングプロトコルをベースに、AI 音声・映像インタラクションを安定して支援します。Espressif チップの RF 性能と組み合わせることで、幅広いシーンでよりスムーズなインタラクション体験を実現します。
強力な端末側処理アルゴリズム
Espressif のシングルチップソリューションは、ローカルウェイクアップと、エコーキャンセル、ノイズ抑制、自動ゲイン制御を含むフロントエンド 3A アルゴリズムを統合しています。さらに、画像補正、回転・クロップなどの端末側画像処理機能を提供し、より自然かつ高信頼なインタラクション体験を実現します。
ームレスなエージェント統合
ESP Private Agents は、組織が導入・保有・管理できるエージェントランタイムです。マルチモーダルエージェント向けに設計されており、音声対話型製品、音声制御対応デバイス、アプリ内カスタマーサービスに対応し、ツール接続、ナレッジベース対応、幅広い LLM 選択肢を備えています。
ユースケース
