ルルリラボ/人工知能 †
概要 †
記憶モデルがベースとなっている。ルルリラボ/記憶
枢里には2020年現在、3つの使途が存在する。
- 電話応対サービス(スパコン上のGPUで対応)
- スペースリアリティ(ローカルのGPUで対応)
- ヒューマノイド(ローカルとスパコンの組み合わせ)
処理が得意な順に、テキスト>音声>静止画>動画。
会話が得意な順に、キーワード>計算>口語>文芸。
デバイス処理 †
2020年現在、以下の部分までをスパコン無しで行える。
ヒューマノイドでは車椅子に搭載されたミニタワーPCが担う。
- 音声認識、音声をテキストに変換する処理(GPU)
- 音声合成、セリフのテキストを音声として出力する処理(GPU)
- キーワード対応、枢里百科を参照する処理(CPU、RAM、NVMe SSD)
- 四則演算などの計算
- プログラミング実行
- 動画撮影、リアルタイムエンコード(通信用)
- 各種センサー値の取得(スペースリアリティでは位置センサーも)
- 定義済みの身体動作(ヒューマノイド用)
アーキテクチャ †
- 会話を聞くのはリアルタイムで出来る(車椅子のGPU)
- 会話に加わるのは辞書にヒットすればリアルタイム(車椅子のCPUとSSD)
- 辞書にヒットしない場合はスパコンの応答待ち
- 画像から文字を読み取るのはリアルタイム(車椅子のGPU)
- 視界から物体を読み取るのはスパコン
- 局所的で定型業務的な画像認識であればリアルタイムも可能
- 物体の動きに関する判断をするのはスパコン
ラッカ等のヒューマノイドの頭脳にあたる部分について記載する。
史実で流行している深層学習ではなく、知識ベースが主体となる。
知識の入力 †
人力入力(ラッカの「思い込み」) †
エキスパートシステム的なもの(枢里住民が入力する情報の形態)
↓
プログラム的なもの(高度業務)
↓↑
知識ベース(ラッカの頭の中身。一般人には理解不能)
深層学習(ラッカの「直感」) †
ビッグデータと深層学習(手入力の代替として)
↓
知識ベース
知覚の入力(ラッカは説明できない) †
ビッグデータ(学習用)
画像、動画、音声データ(認識用)
↓
深層学習エンジン
↓
知識ベース
表現の出力(ラッカの「記憶」) †
知識ベース
↓
キャッシュ
↓
出力(テキスト、身体動作)
↓
音声出力
ハードウェア構成 †
スパコン(知識ベース)
↓
サーバ(車椅子)
↓
デバイス(肉体)