• Espressif 大規模言語モデル (LLM) ソリューション

Espressif は、コネクテッドデバイスを LLM 体験の自然なインタラクションポイントへと変え、デバイス上で LLM を直接実行することなくその活用を可能にします。マルチモーダル入力の取得から、ローカルでのアクション実行、さらにファームウェア、クラウド、アプリの統合までをカバーする包括的な技術スタックにより、プライベート LLM エージェントソリューションの迅速な構築を支援します。

マルチモーダル統合ソリューション

音声、映像、テキスト、センサー入力を活用し、自然で安全、低遅延なスマートデバイス体験を実現します

マルチモーダル入力

Plus Plus Plus

音声

音声入力を通じて、デバイスをインテリジェントな対話フローに接続
  • ウェイクワード
  • ノイズ低減
  • エコーキャンセル

テキスト

テキスト情報をもとに、理解と対話のプロセスを実行
  • テキスト入力
  • 内容理解
  • 整理・分析

ビジュアル

動画や画像入力を処理し、より多様なインタラクションを実現
  • 画像補正
  • 回転・クロップ
  • フレーム応答

センサー

環境情報を能動的に感知し、状況理解と応答処理を行います
  • 環境検知
  • 状態認識
  • 測位
  • 測距

AI Agents

  • OpenAI OpenAI
  • DeepSeek DeepSeek
  • Gemini Gemini
  • Doubao Doubao
  • Qwen Qwen
  • Wenxin ERNIE
  • OpenAI OpenAI
  • DeepSeek DeepSeek
  • Gemini Gemini
  • Doubao Doubao
  • Qwen Qwen
  • Wenxin ERNIE
  • OpenAI OpenAI
  • DeepSeek DeepSeek
  • Gemini Gemini
  • Doubao Doubao
  • Qwen Qwen
  • Wenxin ERNIE
主要な基盤モデルに対応した統一 LLM インターフェース
*記載のプラットフォーム名は接続対応・互換性の説明のみを目的としており、関連する商標は各権利者に帰属します。

多様なシーンに広がる AI インタラクション

ホームコンパニオンから産業協働まで、多様なシナリオのインタラクション需要に ESP チップシリーズが対応します

  • ホーム
  • スマートスピーカー
  • 教育
  • 医療デバイス
  • スマート農業灌漑
  • ロボットアーム

家庭・ペットケア

ビジュアル、音声、ワイヤレス接続を組み合わせ、LLM に家庭内の環境情報を提供。 見守り認識、異常通知、自然なインタラクションを支援します。

S
デバイス接続とエッジ応答
P
ビジュアル理解と画面インタラクション

スマートスピーカー

音声キャプチャ、ウェイクワード検出、音声処理により、LLM を活用した自然な Q&A、制御、コンパニオン型対話を実現します。

S
音声処理とローカルインタラクション
C
無線接続とクラウド接続

コンパニオン・教育

子どものコンパニオン用途に向けて、ビジョン、音声、タッチ操作を統合し、より自然な見守りと、発見を促す学習体験を実現します。

S
音声応答とインタラクションフィードバック
P
ビジョン認識とマルチメディア表示
C
接続拡張と端末連携

医療デバイス

低消費電力センシングと Bluetooth 接続により、血圧、SpO₂、心拍数などの健康データを LLM に連携。健康状態の解釈、リマインダー、個別化された対話を支援します。

H
低消費電力センシングと常時接続
C
データ同期とデバイス連携

スマート農業灌漑

照度、土壌水分、温湿度、pH、気象データなどを LLM に連携し、環境分析とよりスマートな灌漑判断を支援します。

C
データアクセスとリモート連携
S
オンデバイス処理とリアルタイム監視
H
低消費電力センシング

産業用ロボットアーム

ビジュアルキャプチャ、状態センシング、接続機能を組み合わせ、LLM に現場の入力情報を提供。認識・判断、タスク支援、協調制御を支援します。

S
エッジ接続と状態フィードバック
P
ビジュアル判断とタスク実行

伝送から処理まで、実装を加速

スムーズな音声・映像伝送

Espressif は WebRTC ストリーミングプロトコルをベースに、AI 音声・映像インタラクションを安定して支援します。Espressif チップの RF 性能と組み合わせることで、幅広いシーンでよりスムーズなインタラクション体験を実現します。

強力な端末側処理アルゴリズム

Espressif のシングルチップソリューションは、ローカルウェイクアップと、エコーキャンセル、ノイズ抑制、自動ゲイン制御を含むフロントエンド 3A アルゴリズムを統合しています。さらに、画像補正、回転・クロップなどの端末側画像処理機能を提供し、より自然かつ高信頼なインタラクション体験を実現します。

ームレスなエージェント統合

ESP Private Agents は、組織が導入・保有・管理できるエージェントランタイムです。マルチモーダルエージェント向けに設計されており、音声対話型製品、音声制御対応デバイス、アプリ内カスタマーサービスに対応し、ツール接続、ナレッジベース対応、幅広い LLM 選択肢を備えています。

ユースケース

ESP-VoCat
スマート AI 開発キット

玩具、スマートスピーカー、スマート制御端末などの音声インタラクション製品向けに設計され、全二重音声インタラクション、マルチモーダル認識、エージェント制御をサポートします。

Bosch Sensortec
磁気センシングインタラクションソリューション

磁気センシング機能と端末側のインテリジェントインタラクションを組み合わせ、より自然で直感的な感知と応答を実現します。

Bosch Sensortec
AI 駆動型インテリジェントソリューション

センサー機能と AI 駆動型インタラクションを組み合わせ、より豊かな人間とマシンの協働を実現し、製品開発を加速します。

開発リソース

ソフトウェアとハードウェアの開発リファレンスを提供し、ソリューションの迅速な実装を支援します