--------------------------------------------------------------------------------
			    セッション2-1-3
			 SWEST/DAS共同招待講演1

テーマ:デジタル家電統合プラットホーム UniPhier におけるメディアプロセッサ
	   ○木村浩三,藤井茂樹,西道良人,清原督三(松下電器)
--------------------------------------------------------------------------------

--------------------------------------------------------------------------------
プレゼンテーション
--------------------------------------------------------------------------------
○UniPhier登場の背景
三種の神器,デジタル家電が急激に急増
デジタル家電の需要がグローバルに拡大

○デジタル家電の融合化
ユビキタスネットワーク時代のデジタル家電のキーワードは「融合」と「安全に繋がる」の2つである

・放送のデジタル化
・通信のブロードバンド化
→放送と通信の機器の機能が融合

○機能融合が進むデジタル家電
単機能から,複合機能へ進化
メモリカード,ネットによる家電間の相互通信

○デジタル家電に求められるもの
・安心して使える
・長く使える
・快適に使える

!民生機器の厳しい品質に対する要求を満たす必要がある.

○デジタル家電開発の課題
ハードウエアの開発課題も多いが,ソフトウエア開発における課題が特に差し迫っている
・課題
1.高品位AV処理におけるリアルタイム性の保証
2.起動速度の向上,レスポンス性の確保

○ソフトウエア開発規模の急増
以下を例に説明
・携帯電話
・DTV(デジタルTV)
・DVDレコーダ

!ソフトウエア開発規模が数100万ステップ,数千人月に

○ソフトウエア開発規模爆発の原因
1.大規模化による全体設計と開発マネジメントが困難
2.ハードウエア,ソフトウエアがすぐに老朽化
3,機能・技術が,商品の枠を超える

○プラットフォーム戦略
分野ごとに縦割りになっていたプラットフォーム
↓ドメインの壁を打破
ドメインをまたぐプラットホーム
「デジタル家電総合プラットフォームUniphier」の登場

○UniPhierの構成
・ソフトウエアの再利用可能な開発ソフトウエアPF(Platform)
・メディアプロセッサベースのスケーラブルなハードウエアPF

○UniPhierの名前の由来
Universal Platform for High-quality Image-Enhancing Revolutionの略

○プラットフォーム化の目的
・リファレンスシステムをベースとした差分開発による開発生産性向上
・将来商品仕様を想定した,リファレンスシステムにより商品展開を加速

○分野別専用DSPの集約
分野別の専用DSPを新メディアプロセッサに集約しハードウエアPFを統一

○UniPhier搭載SoCの特徴
システム技術とコア技術をSoCに集約し,高性能AV機器を実現
以下のような特徴をもつ
・高品位AV
・低低消費電量
・リアルタイム
・セキュア

○資産再利用可能なソフトプラットフォームの実現
・分野別の個別の開発では,ソフト資産の共用化は困難
・ソフト構造を統一し,共通ハードPF上におけるソフトPFを確立
・マイクロコード,デバドラ,OS,ミドルウエア,ハードウエアを共用

○UniPhierの特徴とその狙い
1.スケーラブルアーキテクチャで柔軟にセット要求に対応
2.高品位,高性能AV機器の実現
3.ソフトウエア開発効率(生産性)の大幅
 Uniphierにより,開発効率を5倍以上に向上
 資産化と最良可能なソフトPF

○UniPhierの狙い
商品分野を越えた技術の横展開による開発生産性の向上
松下の事業領域
・DTV
・DVDレコーダ
・ホームサーバ
・携帯電話
・パーソナルAV
・次世代ゲーム

○コンセプトを実現するハードウエア技術
5-Islands Architecture
基本アーキテクチャを統一し,商品向けに基本ブロックをカスタマイズ
・プロセッサ部
 UniPhierプロセッサ(メディアプロセッサ)
 CPU
・ロジック部
 AV I/O(グラフィックス)
 ストリームI/O(セキュリティーの保証機能も含む)
 メモリ制御

○UniPhierプロセッサアーキテクチャ
・命令並列プロセッサ(IPP)を共通に実装し,CPUソフトの共通性を実現
・データ並列プロセッサ(DPP),ハードウェアエンジン,アクセラレータを拡張して実装
・ハードエンジンやアクセラレータと連携したソフト処理によって,新規コーデックにも対応

○機能分割
・ソフトウエアとハードウエアの連携により,多様なマルチメディア機能を実現
・非均質なハード構成に命令並列とデータ並列を最適にハードマッピングすることにより,高性能化と柔軟性,拡張性(スケーラビリティ)を確立

・命令並列プロセッサ
 メディア処理の命令
 C/C++に対応
 VMP(仮想マルチプロセッサ)
 デバッグ対応
・データ並列アクセラレータ
 アクセラレータハードエンジン
 DPPコア

○プロセッサ拡張とエンジンのアドオン
・デジタル家電の機能に応じてメディア処理をスケーラブルに実現
・命令並列プロセッサを共通とする3タイプのプロセッサに展開

○IPP
IPP概要
メディア処理に対する高い実行性能と優れた性能・面積のバランスを実現
1.メディア処理の並列度に対して演算機能を最適化
 3命令並列実行のプロセッサアーキテクチャを採用
2.C/C++言語に対応した高性能命令並列プロセッサ
3.プロセッサ性能を最大限に引き出す最適化コンパイラ
 プロセッサアーキテクチャとコンパイラの高い親和性を実現

○IPP構成
・PU(Processing Unit)
 16,32ビットの可変長命令
 最大3命令の同時発行
 7段パイプライン
・LMC(local memory controller)
 16ウェイセットアソシアティブ 32KB

・VMPU(virtual multi-processing unit)
 ハードウエアコンテキストスイッチ
 リアルタイム性と性能配分をマネジメント

○IPPブロック図

○VMP概要
VMPはハードウエア,マルチスレッディングをサポートするとともに,割込みシステムを仮想化する
・ハードウエアマルチスレッディング
 スレッド毎にコンテキストメモリを容易
 ハードウエアコンテキストスイッチング機構
・ハードウエアスレッドスケジューリング
 粗粒度スケジューリング(サイクルごとではない)
 スレッド毎にオペレーションの独立性を維持
 スレッド毎に設定された性能を保証
 2種類のスケジューリング(タイムベースとイベントベース)

○VMPのハードウエア図

○VMPの動作(タイムドリブン)
・マクロな視点
 複数の論理プロセッサ
・ミクロな視点
200,300,500サイクル毎に論理プロセッサを切り替える
→性能が20%,30%,50%に分割していることになる
ハードウエアコンテキストスイッチング

○スケジューリング(タイムドリブン)
・ハードウエアエンジンからの非同期イベントによって起床
・ハードウエアエンジンとの協調動作によるぎりぎりの性能確保時に使用
・最大の優先度

○スケジューリング機能
・VMP/WAIT命令によって実行をストップし,ウエイトイベントを起こす
ウエイトタイプ
1.NOPを挿入
2.他のプロセッサに実行時間を譲る

○マイクロスリープ機能
VMPWAIT状態では当確論理プロセッサのクロックを停止

○VMP割込み
・ローカル割込み
特定の論理プロセッサのみが受付可能
・グローバル割込み
全ての論理プロセッサが受け付け可能

○DPP
・プログラマブルな構造により,処理アルゴリズムの変更に柔軟に対応
・画素単位のマクロブロック
・対象アプリ
 直行変換
 動き保証
 動き検出
 MPEG4 AVC
 ・・・

○DPP基本アーキテクチャ
・主要なアプリケーションを評価し最適な並列演算器構成を実現
 SIMD型アーキテクチャのPEユニットによる高効率・柔軟なデータ処理
 複数PEユニットの並列アレイ構成かつPE内の並列演算で演算能力を向上

○アクセラレータ及びハードエンジンの位置づけ
・アクセラレータ
 逐次処理,データ並列処理の加速
・ハードエンジン
 特定処理を加速するエンジン
 
○実用例
・UniPhier2P搭載SoC
 パーソナルAV機器系の低消費電力かつ高性能なSoC
・MPEG2・4などのSD規格の高画質AV処理を実現
 低消費電力アーキテクチャ
 パーソナルAV向け

--------------------------------------------------------------------------------
質疑応答
--------------------------------------------------------------------------------
Q:開発環境はどうするのか?その統一は・・・.
A:DSPのアーキテクチャを統一することで開発環境も統一できる
複数のCPUに対する開発環境も用意している

Q:消費電力の具体的な数値は?
A:具体的数値はいえない・・・
ホームサーバから携帯まで,要求される性能と消費電力を選んで決める

Q:性能向上のネックは?
A:バスの性能,メモリ・インタフェース

Q:コースグレインなアーキにした理由は?
A:SMTはリアルタイム性の保証ができないことを理由にやめた.
キャッシュミスしたときには別のスレッドを立ち上げることも考えている
キャッシュミスを解析するために,プログラムの振る舞いを解析もしている.
今のところSMTは考えていない.

Q:バスの仕様は?
A:バスのインタフェースは社内独自仕様.プロトコルも独自.

Q:開発効率5倍の理由は?
A:分野ごとにプラットホーム化する前の段階と比較して5倍という意味である.
具体的な評価をしているわけではない.

Q:IPPの3命令のスケジューリングは?
A:コンパイラによってスケジューリングしている.動的ではない.

Q:個別製品に適用した場合,従来のノウハウやプログラムの再利用する際の課題は?
A:非常に難しい問題である.
 従来の製品から引き継ぐ点と,新規開発する点を調整している.

Q:部署ごとのIPをUniPhierに統一するのは大変では?
A:大変でした・・・

Q:DPPのプロセッサ間通信方式の意味は?
A:データ転送ができるという意味で,一般的なプロセッサ間通信ではない.

--------------------------------------------------------------------------------