ザイリンクス Xcell Journal 日本語版 86 号 by Xcell Journal Japanese

Xcell journal 8 6 号 2014

ISSUE 85, FOURTH QUARTER 2013

O LL U U TT II O ON N SS SS O

OR R FF O

A A

P R O G R A M M A B B LL E E

Xilinx’s UltraFast ザイリンクス、業界初となる 20nm Methodology: Formula All ProgrammableAデバイスを出荷 for Generation-Ahead Vivado HLS Productivity Median を使用したビデオ用フィルターとソーティングネットワークのデザイン最適なテストベンチ作成のノウハウ

W WO OR R LL D D

Accelerate Cloud Computing with the Zynq SoC Zynq SoC Enables Red Pitaya Open-Source Instruments How to Design IIR Filters for Interpolation and Decimation Middleware Turns Zynq SoC into Dynamically Reallocating Processing Platform

Zynq SoC デザインに RTOS を追加する方法

page 30 Demystifying Kintex-7 レシーバーでテレビの「ホワイトスペース」 Unexpanded Clocks

を新たな通信サービスに活用

ページ

12 www.xilinx.com/xcell/

FPGA / CPLD 評価ボード

LCDモジュール

すぐに使えるFPGAボードで、設計や試作コストが下げられると思います。 ■ FPGAの動作に必要な最低限の機能を搭載単一電源ですぐに活用できます ■ ACM/XCMシリーズはそれぞれ外形やコネクタ位置が同一で置き換えが可能です ■ 豊富なラインナップで１００種類以上の製品をご用意しています

139 x 100 x 10 [mm] (W x H x D)

Kintex -7搭載FPGAボード

UTL-024 シリーズ

XCM-022 シリーズ

■ ユーザI/O

■ 3.3V

MRAM

コントローラ (セイコーエプソン社 S1D13781)

100本

RoHS指令対応品

■ 3.3Ｖ単一電源動作、電源シーケンサ搭載

XCM-022W シリーズ

クレジットカードサイズ

DDR3 SDRAM

Kintex®-7 FBG484 搭載ブレッドボード

XCM-022Z シリーズ

■ XC7K70T-1FBG484C

または XC7K160T-1FBG484Cを搭載 ■ メモリ搭載 ■ ユーザI/O 100本 ■ 3.3Ｖ単一電源動作電源シーケンサ搭載 ■ XCM-022から高速トランシーバ部分を除いた製品です

RoHS 指令対応品

■ ユーザI/O

128本

UTL-025 シリーズ

■ 3.3V

単一電源動作

■ LCD

コントローラ (セイコーエプソン社 S1D13781)

■ 内蔵圧電ブザーにより発音

可能

5.0

■ プラスチック製ベゼル付き

DDR3 SDRAM

■ XC7K70T-1FBG484C

RoHS指令対応品

タッチパネル付き5″ カラーLCDモジュール

XCM-112 シリーズ Rocket I/O

3.5

■ 黒とグレーの2モデル

Kintex®-7 FBG484 搭載ブレッドボード

ハーフカードサイズ

可能

■ プラスチック製ベゼル付き

94 x 78 x 9.5 [mm] (W x H x D)

■ XC7K70T-1FBG484C

RoHS 指令対応品

または XC7K160T-1FBG484Cを搭載 ■ シンプル構成 ■ ユーザI/O 100本 ■ 3.3Ｖ単一電源動作電源シーケンサ搭載 ■ XCM-022からメモリと高速トランシーバ部分を除いた製品です

■ 内蔵圧電ブザーにより発音

■ 外形寸法

クレジットカードサイズ

MRAM

単一電源動作

■ LCD

または XC7K160T-1FBG484Cを搭載

Kintex®-7 FBG484 搭載ブレッドボード

RoHS指令対応品

タッチパネル付き3.5″ カラーLCDモジュール

Kintex®-7 FBG484 搭載ブレッドボード

■トランシーバとメモリ搭載

5.0

■ 黒とグレーの2モデル

■ XC7K70T-1FBG484C

可能

■ 外形寸法

■ スピードグレード変更などのカスタマイズもご相談ください

DDR3 SDRAM

単一電源動作

■ 内蔵圧電ブザーにより発音

コネクタはTerasic 社のディスコン品（TRDB-LTM）に準拠したピンレイアウト

■ 基本的に即納体制で最短翌日からご活用いただけます

SIF40

■ 3.3V

■ I/F

■ 豊富な納入実績で安心してお使いいただけます

Rocket I/O

UTL-021 シリーズ

■ プラスチック製ベゼル付き

■ 回路図、マニュアルは購入前でも自由に参照できます

クレジットカードサイズ

タッチパネル付き5″ カラーLCDモジュール

■ 外形寸法

または XC7K160T-1FBG484Cを搭載

■ 3.3Ｖ単一電源動作、電源シーケンサ搭載

139 x 100 x 10 [mm] (W x H x D)

RoHS指令対応品

■ 黒とグレーの2モデル

Kintex®-7 搭載 USB-FPGA ボード

EDX-008

クレジットカードサイズ

USB Conﬁg

USB Comm

DDR3 SDRAM

MRAM

CameraLink 実験用ボード

HI-SPEED

■ XC7K70T-1FBG484Cを搭載 ■ ユーザI/O

100本 ■ USB経由でFPGAコンフィギュレーション ■ USBポートによりPCとUSB通信が可能 ■ 5Ｖ単一電源動作、電源シーケンサ搭載

RoHS指令対応品

Virtex -5搭載の新製品 ®

Virtex®-5 FFG676 搭載ブレッドボード

XCM-113 シリーズ

ハーフカードサイズ

DDR2 SDRAM

■ XC5VLX30-1FFG676C、 XC5VLX50-1FFG676C、

XC5VLX85-1FFG676C または XC5VLX110-1FFG676Cを搭載 128本 ■ 3.3Ｖ単一電源動作 ■ ユーザI/O

RoHS指令対応品

UTL-023 当社ACM/XCM-2シリーズにCameraLink用コネクタを接続するためのボードです。電源付きユニバーサルボード Z K B - 1 0 6 をベースに CameraLink入力用コネクタとC a m e r a L i n k 出力用コネクタおよび、LCD表示モジュールUTL-021用のI/O コネクタを装備しています。

※その他 FPGA Boardやアクセサリを100 種類以上ラインナップしています。詳しくはウエブをご覧ください。

L E T T E R

F R O M

T H E

P U B L I S H E R

ザイリンクス、UltraScale 時代に向けて一世代先へリードする技術力を強化今年はザイリンクスと皆様にとって最高の年になると予想しています。過去 6 年にわたり、筆者はザイリンクスが Moshe Gavrielov（モーシェガブリエロフ）CEO のリーダーシップの下で達成してきた素晴らしい成果を目の当たりにしてきました。多くの成果の中でも特に重要なのは、ザイリンクスがリリースした 3 世代にわたる製品と、全く新たな最高クラスのデザインツールスイートの開発です。さらに、数年前に 7 シリーズ All Programmable デバイスをリリースし、2013 年 12 月には業界で初めて 20 ナノメートルデバイスを出荷したザイリンクスは、FPGA テクノロジのリーダーから、半導体とシステムのイノベーションにおけるリーダーへと成長しています。筆者にとって、7 シリーズはザイリンクスの飛躍の始まりを示す製品です。7 シリーズでザイリンクスは、28nm で最高の FPGA を市場に供給したばかりでなく、3D IC と Zynq SoC という 2 つの全く新たなデバイスクラスを開発したのです。一方、Vivado® Design Suite と UltraFast ™ 設計手法は、ザイリンクスがゼロから開発したツール群であり、顧客の革新的な製品の迅速な市場投入を支援します。7 シリーズにおけるこれらの進化それ自体が注目に値しますが、さらに印象的なのは、ザイリンクスの将来の成功に向けた確実なロードマップと、顧客に貢献するイノベーションに向けたロードマップが確立されたことです。過去数四半期にわたり、この成功が外の世界でも疑いのないものになるのを目にすることは、とても実り多い経験でした。ザイリンクスの 7 シリーズデバイスは、現在 28 nm FPGA 市場全体の 70% 以上を占有しています。これらの数字は、「ザイリンクスが一世代先を行っている」というマーケティングの方向性には真にザイリンクスの技術力があることを裏付けています。筆者はジャーナリスト時代に、この業界においてザイリンクスと競合他社との比較で、優位性はどちらが高いかに関する議論をしばしば目にしました。しかし、これに関しては堂々巡りの議論が繰り返されるばかりで、どちらの側にも具体的な根拠はほとんどなかったため、あたかも後部座席で 2 人の子どもが言い合っているのを聞いているように、意味のないものになっていきました。もちろん、現在ザイリンクスに勤務している筆者が公平な立場にあるとは言えません。しかし筆者は、ザイリンクスの勢いと一世代先へリードする技術力は、2013 年にはまだ皆様の目に明らかでなかったとしても、2014 年にはそうなると断言できます。ザイリンクスが他社に先駆けて出荷してきた過去 2 世代の製品の数を見れば、ザイリンクスが現状に満足せず、競合他社の挑戦を受けて立つ構えであることは明らかです。本号のカバーストーリーで説明するように、2013 年後半、ザイリンクスは ( まだ 20nm 製品の出荷に至らない ) 競合他社に数カ月先立つ形で業界初の 20nm FPGA を顧客に供給し、20nm Kintex® および Virtex® UltraScale ™ デバイスの製品ラインを発表しました。これらの UltraScale 製品には、競合他社の最大のデバイスの 4 倍の容量を備えた Virtex FPGA が含まれており、実装密度におけるザイリンクスのまぎれのない優位性は引き続き維持されています。新しい UltraScale ファミリは ASIC クラスのデバイスであり、未来を形作るイノベーション (1 年ほど先の技術ではなく、エレクトロニクスの将来を規定するような製品 ) の開発に取り組んでいる皆様に驚異的な価値をもたらします。さらにエキサイティングなことに、これらのリリースは、これから本格化するザイリンクスの UltraScale 時代の始まりにすぎないのです。

Mike Santarini 発行人

VIEWPOINTS Letter From the Publisher ザイリンクス、UltraScale 時代に向けて一世代先へリードする技術力を強化 … 1

XCELLENCE BY DESIGN APPLICATION FEATURES Profiles in Xcellence Kintex-7 FPGA レシーバーでテレビ放送の「ホワイトスペース」を新たな通信サービスに活用 … 12

Cover Story

ザイリンクス、業界初となる

20nm All Programmable デバイスを出荷

86 号

THE XILINX XPERIENCE FEATURES Ask FAE-X Vivado HLS ツールを使用したビデオ処理用の Median フィルターとソーティングネットワーク… 16

Xplanation: FPGA 101 最適なテストベンチ作成のノウハウ… 26

Xplanation: FPGA 101 Zynq SoC デザインに RTOS を追加する方法 … 32

Xplanation: FPGA 101 ザイリンクスデザイン用のカスタム XBD ファイルの作成 … 38

32 XTRA READING Tools of Xcellence 最適なコンバーターの選択 : JESD204B と LVDS … 44

Tools of Xcellence SMC で生成したペリフェラルと AXI4-Lite インターフェイスをザイリンクス環境に統合する方法 … 48

広告索引有限会社ヒューマンデータ ……… 表 2 Excellence in Magazine & Journal Writing 2010, 2011

Excellence in Magazine & Journal Design 2010, 2011, 2012

COVER STORY

Xilinx Ships Industry’s First 20-nm All Programmable Devices

ザイリンクス、業界初となる

20nm All Programmable デバイスを出荷 Mike Santarini Publisher Xcell Journal Xilinx, Inc.

4 Xcell Journal 86 号

COVER STORY

最新の製品ラインでは、

440 万ロジックセルを搭載した 3D Virtex UltraScale FPGA で容量の新記録を達成

ザイリンクスは 2013 年 11 月、業界初の 20 ナノメートル All Programmable FPGA となる Kintex® UltraScale ™ XCKU040 を、競合他社の 20nm デバイスより数カ月先に出荷し、一世代先をリードする技術力の重要なマイルストーンを達成しました。続いて 12 月には、この成果を基に、すべての 20nm Kintex UltraScale および Virtex® UltraScale 製品ラインを発表しました。Virtex UltraScale ファミリには Virtex UltraScale VU440 が含まれています。3D IC テクノロジをベースとするこの 440 万ロジックセルデバイスは、ザイリンクスが既に 28nm Virtex-7 2000T で保持していた FPGA の最大容量および半導体トランジスタの最大数の世界記録を更新するものです。ザイリンクスのコーポレートストラテジおよびマーケティング担当シニア副社長である Steve Glaser は、「ザイリンクスは 20nm 製品の販売を始めており、ザイリンクスの多数の 20nm UltraScale デバイスのうち最初のものを出荷しています」と述べています。「ザイリンクスは、大成功を収めた 28nm 7 シリーズ All Programmable デバイスで確立した FPGA 市場におけるリーダーシップを、20nm UltraScale アーキテクチャでさらに拡大しています。現在ザイリンクスは、TSMC 社の 20SoC プロセス技術で製造した業界初の 20nm デバイスを競合他社より数カ月早く顧客に供給しているだけでなく、業界で最も高度なシリコンアーキテクチャを利用したデバイスと、 ASIC クラスの強力なデザインツールスイートおよびデザイン手法を提供しています。」 20nm Kintex UltraScale および Virtex UltraScale 製品ラインのすべてのデバイスは、ASIC クラスの性能や機能とともに、大成功を収めたザイリンクスの 7 シリーズ製品ラインを上回る低消費電力と大容量を実現します ( 図 1)。28nm シリコン製造ノードで製造された 7 シリーズデバイスは、現在プログラマブルロジックデバイス市場の 70% 以上のシェアを占めています。その上、ザイリン

http://japan.xilinx.com/

COVER STORY

Logic Cells (LC)

478

1,161

1,995

4,407

Block RAM (BRAM; Mbits)

115

DSP48

1,920

5,520

3,600

2,880

Peak DSP Performance (GMACs)

2,845

8,180

5,335

4,268

104

Peak Transceiver Line Rate (Gbps)

12.5

16.3

28.05

32.75

Peak Transceiver Bandwidth (Gbps)

800

2,086

2,784

5,101

PCI Express Blocks

100G Ethernet Blocks

150G Interlaken Blocks

1,866

2,400

1,866

2,400

500

832

1,200

1,456

Transceiver Count

Memory Interface Performance (Mbps) I/O Pins

図 1 - 20nm Kintex および Virtex UltraScale FPGA は、業界をリードする機能を提供し、 Kintex および Virtex 7 シリーズデバイスを補完します (最大数を掲載) クスは UltraScale でデバイスアーキテク

を比較すると、Kintex UltraScale デバイ

ん。ザイリンクスは既に 20nm UltraScale

チャの改良をさらに進め、Vivado Design

スは Kintex-7 デバイスに比べてロジックと

デバイスを供給しており、これによって顧客

Suite には ASIC クラスの機能強化を実現し

DSP 機能が大幅に向上しています。その理

は今すぐ革新的な製品の開発が可能です。ザ

ました。2013 年 10 月、ザイリンクスは、由は、高い信号処理帯域幅を必要とするア

イリンクスは UltraScale FinFET デバイス

UltraFast デザイン手法と呼ばれる合理化さ

プリケーションの大部分が、現在 Kintex ク

を競合他社と同じスケジュールで供給する予

れた手法を発表しました ( 詳細は Xcell Jour-

ラスの価格帯と実装密度を要求する傾向が

定です。これらのデバイスと、Vivado De-

nal 日本語版 85 号のカバーストーリーを参

あるからです。実装密度や DSP 機能にそれ

sign Suite および UltraFast 手法の ASIC

照。http://issuu.com/xcell-journal-japa-

ほどの向上を必要としないアプリケーション

クラスの利点により、ザイリンクスは一世代

nese/docs/xcell_85)。今後ザイリンクスは、では、Kintex-7 は現在でも非常に実用的な

先へリードする技術力を基にさらに進化して

デザインインの手段となります。」

いきます。」

に基づいて、20nm UltraScale 製品ライン

Saban によると、マルチノード手法によ

Saban によると、これらの進化は信頼性

に続いて 16nm FinFET UltraScale デバイ

り、ザイリンクスの幅広いユーザーは、業界

の高い製造プロセスを基盤としています。「ザ

スを展開していきます。

で最も強力な All Programmable デバイ

イリンクスは TSMC 社という業界で最も強

ザイリンクスの製品ラインマーケティング

スの選択肢を利用できると同時に、Vivado

力なファウンドリパートナーを得ており、同

マネージャーである Kirk Saban は、「私

Design Suite と UltraFast 手法による比

社には納期と信頼性に関する確かな実績が

「マルチノード戦略」と呼ばれる手法 ( 図 2)

たちが今いるのはマルチノードの世界です。類のない高い生産性が得られます。

あります」と Saban は述べています。「ファ

そこでは、顧客はザイリンクスの 7 シリー

「現在業界には次の間違った認識が広まっ

ウンドリは TSMC 社の主要業務であり、半

ズファミリ、UltraScale 20nm ファミリ、ており、競合他社はインテルの 14nm Fin-

導体業界の有名企業の大半のデバイスを製

今後の UltraScale 16nm FinFET ファミ

FET シリコンデザインプロセスが完成して

造しています。しかも、TSMC 社の前 CEO

リのうちシステム要件に最も適したノード

から自社の次世代デバイスの製造に取り掛か

( 現在は顧問 ) である Chenming Hu 氏は

でデバイスのデザインインを行います」と

るため、ザイリンクスは一足飛びに追い抜か

FinFET プロセスの事実上の開発者であり、

述べています。「たとえば、20nm Kintex

れるだろう」と Saban は述べています。「私

TSMC 社の次世代プロセス用 FinFET の開

UltraScale デバイスと Kintex-7 デバイス

たちも手をこまねいているわけではありませ

発力には非常に感銘を受けました。」

6 Xcell Journal 86 号

COVER STORY

KINTEX および VIRTEX ULTRASCALE デバイスのトランジスタ数

ました。

イスは、16.3Gbps のバックプレーン動作を

「ザイリンクスによる DSP のイノベーショ

サポートします。Kintex UltraScale ファミ

ンを詳細に検討すると、入力幅を広げた乗

リの低速グレードのデバイスも 12.5Gbps

新たなシリコンプロセスノードが登場

算器に行き着きます。これにより、ファンク

の素晴らしいトランシーバー性能を備えてお

するたびに、業界は製造とデザインの新た

ション当たりの使用ブロック数を削減し、あ

り、これはワイヤレスアプリケーションには

な課題に直面します。その点では、20nm

らゆるタイプの DSP アプリケーションで精

特に重要です。一方、Virtex UltraScale 製

ノードも例外ではありません。このジオメト

度を高めることができます」と Saban は述

品には、28Gbps のバックプレーン動作と

リは、配線遅延、クロックスキュー、およ

べています。「またワイヤレス通信分野の顧

33Gbps のチップ間およびチップ - 光デバイ

び CLB パッキングに関する新たな課題をも

客のために、DSP48 それ自体の中で可能

ス間インターフェイスに対応するトランシー

たらします。しかしザイリンクスは、Kintex

になった FEC、ECC、および CRC インプ

バーが搭載されます。

UltraScale および Virtex UltraScale デ

リメンテーションに関連して、各種の追加機

「UltraScale デバイスには、各種の重要

バイスでこれらの課題を克服し、全体的な性

能を組み込みました。」

な統合型ハード IP ブロックを追加しました」

能と使用率を大幅に向上させました ( サイド

ブロック RAM の面では、ザイリンクスは

と Saban は述べています。「Virtex および

バー「FPGA で ASIC クラスのステータスを

データカスケード出力をハード化し、ハード

Kintex UltraScale ファミリデバイスには、

実現する適切な手法」を参照 )。

化された革新的な新機能によって、消費電力

100Gbps イーサネット MAC をハード IP コ

ノードの複雑性に基づいて、ザイリンクス

だけでなく BRAM の性能も向上させました。

アとして追加しました。また、Virtex および

はアーキテクチャをいくつかの点でブロック

ザイリンクスは、20nm Kintex および

Kintex UltraScale 製品ラインに、ハード化

レベルで改善し、すべての改善点を Vivado

Virtex UltraScale 製品ラインに 2 種類の

された 150Gbps Interlaken インターフェ

デザインツールと協調最適化して、最大限

トランシーバーを採用しています。中速およ

イスと、Gen3x8 までの動作に対応するハー

の帯域幅と最大限の信号処理能力を実現し

び高速グレードの Kintex UltraScale デバ

ド化された PCI Express® Gen3 ブロック

Past

Single Node, Only FPGAs

FPGA 130nm

FPGA 90nm

FPGA 45/40nm

Future

Concurrent Nodes with FPGAs, SoCs and 3D ICs

28nm: Long life with optimal price/performance/watt and SoC integrations Open for business! 20nm: Complements 28nm for new high-performance architectures 20 16nm: Complements 20nm with FinFET, multiprocessing, memory 1

図 2 - ザイリンクスの「一世代先へ」戦略ではマルチノード製品開発が推奨され、顧客の要件に最も適合するノードの FPGA、SoC、および 3D IC の製品ラインが同時にリリースされます。

http://japan.xilinx.com/

COVER STORY

FPGA で ASIC クラスの

ステータスを実現する適切な手法以前 ASIC 設計者が悩んでいた問題に、現在は FPGA 設計者

CLB は再設計されました。ロジックブロックのデザインはより稠

が直面しています。それは、配線遅延がデザイン性能に決定的な

密にパックされ、その結果、CLB 間の必要な配線リソースは削減

影響を与えるという問題です。長年にわたってトランジスタの速度

されます。また、配線パスも短縮されます。UltraScale アーキテ

はデナードのスケーリング則に従って向上し、トランジスタの 1 平

クチャの CLB 内の変更には、CLB 内の全フリップフロップへの

方ミリメートル当たりの実装密度はムーアの法則に従って向上して

専用入力および出力の追加 ( これにより、フリップフロップを個別

きました。残念なことに、インターコネクトにはこの法則は当ては

に使用できるようになり、使用率が向上 )、フリップフロップクロッ

まりません。ムーアの法則に従って、ワイヤが薄く、フラットにな

クイネーブル信号のさらなる追加、CLB のシフトレジスタおよび

るにつれて、伝送速度は遅くなります。最終的には、トランジスタ

分散 RAM コンポーネントに対する個別クロックの追加が含まれ

遅延は無視できるほどに小さくなり、配線遅延が支配的になりま

ます。改善された CLB の使用率とパッキングの概念図を図 1 に

す。FPGA の実装密度が向上し、ザイリンクスの UltraScale ™

示します。

All Programmable デバイスが ASIC クラスデザインの領域に入

この図の例では、以前は 16 個の CLB でインプリメントされ

るにつれて、FPGA にも同じ問題が現れます。この問題を克服す

ていた回路ブロックが、現在では 9 個の改良された UltraScale

るために、UltraScale デバイスの再設計が行われてきましたが、

CLB に適合しています。図中の小さな青い正方形と三角形の分布

解決策は簡単ではなく、かなり複雑なものとなりました。ここでは

は CLB 使用率が向上したことを示し、赤い線の減少は必要な配線

その手法について説明します。

量が削減されたことを示しています。

ステップ 1 : ブロックをコンパクトにして信号の伝送距離を短縮する

ステップ 2 : 配線リソースを追加する

これは当然のことに思われます。必要は発明の母と言います

数は N の二乗に比例して増加します ( ここで、N は IC プロセス技

が、UltraScale の実装密度ではこの手法を工夫する必要があり

術のリニアスケーリング係数 )。残念なことに、 FPGA の配線リソー

ました。Vivado ® Design Suite がロジックデザインを CLB に

スは N に直線的に比例して増える傾向があり、CLB 数の増加ペー

より効率的にパックできるように、UltraScale アーキテクチャの

スには追いつけません。何らかの対策を講じて問題を解決しない限

ムーアの法則に基づくトランジスタ密度の上昇に伴って、CLB の

図 1 - UltraScale アーキテクチャでは、CLB の使用率が向上し、必要な配線量が減ります。

Steve Leibson Editor Xcell Daily Blog Xilinx, Inc.

8 Xcell Journal 86 号

COVER STORY

り、この状況では何の見返りも得られません。ULTRASCALE アーキテクチャ用の解決策として、CLB 密度の上昇に追随して配線可能性がより迅速に向上するように、ローカル配線リソースがさらに追加されました。図 2 にその結果を示します。ただし、ハードウェア配線リソースを増やすだけでは不十分です。これらの新しいリソースを活用できるように、デザインツールの配置配線アルゴリズムを強化する必要があります。この必要に応じて、ザイリンクス Vivado Design Suite がアップグレードされました。

ステップ 3 : クロックスキューの増加に対処するご存じないかもしれませんが、FPGA のクロッキングは単純化できたため、非常に単純なものでした。初期世代の FPGA は中央のクロック分配スパインに依存しており、このスパインがデバイス (IC) の幾何学的中心からファンアウトして、すべてのオンチップロジックにクロックを供給していました。この種のグローバルクロッキング方式は、Virtex UltraScale および Kintex UltraScale All Programmable デバイスファミリなどの ASIC クラスの FPGA では有効に機能しません。この方式では、CLB 密度の上昇とクロックレートの向上に対応できないのです。したがって、UltraScale デバイスは、図 3 に示すような根本的に改良されたクロッキング方式を採用しています。 UltraScale アーキテクチャのクロック分配ネットワークは、複数のクロック分配ノードを多数のオンチップクロックドメインの幾

図 3 - 根本的に新しいクロッキング方式では、複数のクロック分配ノードを多数のオンチップクロックドメインの幾何学的中心に配置できます。

何学的中心に配置できる、リージョン化、セグメント化されたクロッキングインフラストラクチャで構成されます。個々のクロック分配ノードは、適切なサイズのインフラストラクチャセグメントから構築された個々のクロックツリーをドライブします。この手法には、少なくとも次の 3 つの大きな利点があります。 1. クロックスキューが急速に縮小する。 2. 配線可能なクロッキングリソースが大幅に増える。 3. ただちにタイミングクロージャが容易になる。しかし、デザインツールが新しいクロッキング方式をサポートしない限り、クロッキングインフラストラクチャを改善するだけでは不十分です。したがって、Vivado Design Suite は、ステップ 2 で説明した CLB 間の配線の向上に応じてアップグレードされたのと同じように、新たなクロッキング方式に応じてアップグレードされました。ザイリンクスは、上記の 3 つのステップで、ハードウェアアーキテクチャとデザインツールの両方を大きく変更する必要がありました。ザイリンクスが言う UltraScale アーキテクチャと Vivado Design Suite の協調最適化とは、このようなことを意味しています。これには多大な労力が必要でしたが、ASIC クラスの All

図 2 - 青い線は、トランジスタ密度の上昇に伴う CLB の指数関数的な増加を示しています。赤い直線は、よりペースが遅い、CLB 間インターコネクトの直線的な増加を示しています

(前世代の配線リソースを使用)。

赤い直線と青い曲線の差が急速に広がることに注意してください。赤い曲線は、UltraScale

アーキテクチャに使用される強化されたローカル

CLB 間インターコネクト方式による配線可能性の向上を示しています。

Programmable デバイス製品ラインを実現するには、どうしても必要なことでした。詳細は、ホワイトペーパー『よりスマートで高性能なシステムを実現するザイリンクスの UltraScale アーキテクチャ』(http://japan. xilinx.com/support/documentation/white_papers/wp434ultrascale-smarter-systems.pdf) を参照してください。

http://japan.xilinx.com/

COVER STORY

も追加しました。」

ネクト (SSI) テクノロジにより、マルチダイ

セルを搭載した Virtex-7 2000T ではトラ

いずれの UltraScale ファミリも DDR4

テクノロジ全体でダイ間の帯域幅を向上させ

ンジスタ数と FPGA ロジックセル容量の世

メモリをサポートしており、7 シリーズデバ

る重要な機能強化がなされました。「SSI は、界記録を達成しました。Virtex UltraScale

イスで利用できるメモリに比べてデータレー

非常に大規模なデバイス内で複数のダイがす

XCVU440 では、ザイリンクスは (5,000

トが 40% 向上し、メモリインターフェイス

べて 1 つのダイとして機能するモノリシック

万 ASIC ゲートに相当する ) プログラミン

の全体的な消費電力は 20% 削減されます。

デバイスの実現を可能にします」と Saban

グ用の 440 万ロジックセルを搭載した

Saban によると、セキュリティの面では、

は述べています。

20nm デバイスを実現することで、自社の

キーの保護を強化する機能のほか、より詳

ザイリンクスは、この SSI テクノロジを利

記録を更新しています。このデバイスは、

細で高度な認証方式をインプリメントする機

用して、同社が保持していた FPGA の最大

200 億個以上のトランジスタを搭載した世

能が追加されました。また、Vivado ツール

容量と最大 IC トランジスタ数の世界記録を

界で最も高密度の IC でもあります。

スイートはこれらの新しい強化機能をすべて

再び更新しました。

「このレベルの容量のデバイスは、ASIC、

サポートするということです。

ASSP、システムエミュレーションおよび

容量の世界記録を更新確かに、20nm UltraScale 製品ライ

プロトタイプ用に最適であると予想していま

ンの花形となるのは Virtex UltraScale

トタイプ向け大規模商用ボードの製造に特

す。「Kintex UltraScale デバイスは、実際

XCVU440 です。ザイリンクスは、各種の

化したベンダーもありますが、多くの企業は

には性能に関してではなく、実装密度に関し

賞を受賞した 3D スタックドシリコンイン

独自のプロトタイプシステムを構築してお

てのみ「ミッドレンジ FPGA」なのです」と

ターコネクトテクノロジでこのデバイスをイ

り、大半は自社のプロトタイプ用に非常に

Saban は述べています。

ンプリメントしました。このテクノロジは、大容量の FPGA を探しています。Virtex-7

最後に、20nm UltraScale デバイスは、

複数のダイを並べて、それぞれのダイが接続

2000T により、ザイリンクスは 28nm

ザイリンクスが 7 シリーズで他社に先駆けて

されるシリコンインターポーザー上にインプ

ノードでこの分野の圧倒的なリーダーと

採用し、素晴らしい成功を収めた 3D IC テ

リメントします。この手法により、ザイリン

なりました。「プロトタイプ用途の顧客は、

クノロジを基盤としています。ザイリンクス

クスは 28nm ノードでムーアの法則を超え

Virtex UltraScale XCVU440 で提供する

の第 2 世代スタックドシリコンインターコ

る容量を実現し、1,954,560 個のロジック

機能をさらに歓迎するはずです」と Saban

Saban は、Virtex UltraScale デバイスと Kintex UltraScale デバイスが同じファブリック性能を共有していると述べていま

す」と Saban は述べています。ASIC プロ

400G OTN Switching

4X4 Mixed-Mode Radio

400G Transponder

100G Traffic Manager NIC

400G MAC-to-Interlaken Bridge

Super-High Vision Processing

2x100G Muxponder

ASIC Prototyping

256-Channel UltraSound

48-Channel T/R Radar Processing

図 3 - ザイリンクス UltraScale デバイスは各種の革新的な次世代 Smarter System に最適です。

10 Xcell Journal 86 号

COVER STORY

は述べています。

じくらい重要なのは、UltraScale デバイス

に、製品の差別化要因となる追加のパケット

が 400G の帯域幅をサポートする能力です。処理機能にロジックを振り向けることができ

CFP4 を使用した 400G 通信への UltraScale デバイスの利用

次世代の配線方式と ASIC スタイルのクロッ

Saban によると、ザイリンクスは、すべて

る大量のデータフローをサポートします。」

のユーザーが次世代の Smarter System を開発できるように、次世代の機能を提供する 20nm UltraScale 製品ラインを入念に計画しました ( 図 3)。20nm Kintex および Virtex 製品ラインの機能セットは、ネットワーキング、データセンター、ワイヤレス通信の各分野の主要アプリケーションに特に適しています。現在、ネットワーキング業界には 100G アプリケーションの増設ラッシュが起きています。Saban によると、最先端のシステムは既に 100G テクノロジを採用しています。 100G テクノロジは急速に普及して主流と

ます」と Saban は述べています。

キングにより、400G システムに必要とされさらに、Saban によると、Virtex UltraScale デバイスはフラクショナル PLL をサポートしているので、デザインに必要とされる外部電圧制御型発振器の数を減らすことができます。「UltraScale デバイスでは、1 つの VCXO を使用し、ほかの必要な周波数をすべて内部で生成できます」と Saban は述べています。「したがって、 CFP4 光モジュールによって得られるコスト削減と省電力効果以外に、ラインカードそれ自体でシステム統合による BOM コストと消費電力の削減が可能です。」

ワイヤレス通信への UltraScale デバイスの利用ワイヤレス通信機器業界では、各ベンダーは LTE 機器と LTE Advanced 機器を同時に展開しながら、より先進的なシステムの開発にも着手しています。新しいシステムは、マルチ送信、マルチ受信、およびビームフォーミング機能を実現する高度なアーキテクチャの形で登場するに違いありません。 Saban によると、LTE システムおよび LTE Advanced システムの中心となる最新世代のビームフォーミング機器は、一般に 2 個の Virtex-7 X690T FPGA をベースとするアーキテクチャを利用しています。Virtex-7

に接続するペリフェラル市場にまで拡大して

低コスト、低消費電力の NIC への UltraScale デバイスの利用

います。同時に、ネットワーキング業界の大

現在のクラウドコンピューティングアプリ

せにあります。現在ザイリンクスの顧客は、

手顧客は、既に次世代の 400G 機器やテラ

ケーションの急成長とともに、IT 部門は、さ

Kintex UltraScale デバイスを使って、同じ

ビット機器の開発に取り組んでいます。新し

らに高機能、低消費電力、低コストのデータ

ジョブをより低コストのワンチップデバイス

い UltraScale デバイスは、現在 100G ソ

センター用コンピューティングリソースを求

で実行できると Saban は述べています。

リューションを開発中の顧客にも、先進の

めています。x8 Gen3 ブロックを内蔵した

「Kintex UltraScale デバイスは、ミッド

400G テクノロジへの移行を進めている顧

ザイリンクス Virtex-7 XT デバイスは、ほと

レンジのデバイスとして DSP ブロック数が

客にも最適です。

んどの先進データセンターアーキテクチャ

40% 増えています」と Saban は述べてい

ザイリンクスは、第 1 世代の SSI テクノ

の心臓部であるネットワークインターフェイ

ます。「またこのデバイスは、前置加算器の二

ロジにより、各種の賞を受賞した Virtex-7

スカードの中心となる要素として利用されて

乗機能と追加の累算器フィードバックパスを

H580T を開発しました。このデバイスは、

きました。

備えているため、DSP48 の効率向上、式の

CFP2 光モジュールを採用したネットワーク

ネットワークインターフェイスカード

折り畳み、より効率的な演算が可能です。つ

向けのオンチップ 2x100G トランスポンダ

(NIC) では、PCI Express 側のスループット

まり、UltraScale アーキテクチャでは、2 チッ

の開発に利用されました (Xcell Journal 日

( 出口 ) がイーサネット側のスループット ( 入

プ Virtex クラスのアプリケーションを、48

本語版 79・80 合併号のカバーストーリー

口 ) に対応している必要があります。「また、チャネル処理に対応したワンチップの Kintex

を参照。http://issuu.com/xcell-journal-

100G NIC には複数の PCIe® Gen3 統合ブ

KU115 にインプリメントできます」。Kintex

japanese/docs/xcell_79-80)。

ロックが必要です」と Saban は述べていま

UltraScale KU115 は 5,520 個の DSP ブ

現在では、ザイリンクスの第 2 世代 SSI

す。「前世代の製品では、これらの要件を満

ロックと 2,160 個の BRAM を備えており、

テクノロジを利用して、顧客はワンチッ

たす x8 Gen3 ブロックを内蔵したデバイス

Saban によると「GPU をはるかに上回る業

プ FPGA トランスポンダラインカードや

は Virtex-7 XT しかありませんでした。」

界最高の信号処理性能」を提供します。

CFP4 光モジュールを開発し、さらに素晴ら

現在の UltraScale アーキテクチャで

さらに、ザイリンクスの Vivado Design

しい成果を達成できます。

は、より低コストで低消費電力の Kintex

Suite には、クラス最高の高位合成ツールで

「CFP4 モジュールへの移行とワンチッ

UltraScale FPGA により、これらと同じ性

ある Vivado HLS ツールが含まれています。

プ FPGA デバイスへの 400G デザインの

能要件を達成することが可能です。Kintex

このツールは、ユーザーがビームフォーミン

実装を計画している設計者は、いくつかの

UltraScale FPGA は、複数の PCI Express

グやほかの演算量の多いアプリケーション用

理由で UltraScale デバイスを必要としま

Gen3 統合ブロックと (7 シリーズではソフ

の複雑なアルゴリズムを効率的にインプリメ

す」と Saban は述べています。「第 1 に、

ト IP コアで実装されていた ) 統合型 100G

ントできるように協調最適化されています。

UltraScale デバイスは、次世代のチップ間

イーサネット MAC を搭載しています。

ザイリンクスの 20nm UltraScale 製品

インターフェイス (CAUI4) を介して CFP4

「Kintex UltraScale デバイスに NIC をイ

ラインの詳細は、http://japan.xilinx.com/

光モジュールとのインターフェイスをとる多数

ンプリメントすると、ミッドレンジデバイス

products/technology/ultrascale.html

の 32G トランシーバーを備えています。同

にアプリケーションをインプリメントできる上

をご覧ください。

なっており、デバイスを 100G ネットワーク

X690T FPGA が選ばれた理由は、大量の DSP リソースと BRAM リソースの組み合わ

http://japan.xilinx.com/

PROFILES IN XCELLENCE

Kintex-7 FPGA Receiver Mines TV ‘White Space’ for New Comms Services

Kintex-7 FPGA レシーバーでテレビ放送の「ホワイトスペース」を新たな通信サービスに活用 Mike Santarini Publisher Xcell Journal Xilinx, Inc.

Adaptrum 社は、オープン周波数帯を利用したサービス向けの完全な伝送システムを初めて商品化した企業です。同社の製品はザイリンクス

All Programmable FPGA を搭載しています。

12 Xcell Journal 86 号

PROFILES IN XCELLENCE

2009 年に米国連邦通信委員会 (FCC) がアナログテレビ放送からデジタル放送へ強制的に移行したことは、多くの人にとっては特に重要な出来事ではありませんでしたが、通信サービスプロバイダーにとってはビジネスの成長の大きな機会を意味していました。デジタルへの移行後まもなく、FCC はそれまでデジタル放送には不要だったアナログテレビ放送の周波数帯の一部を競売に付し、通信会社、救急サービスや、ほかの事業体に売却しました。しかし競売の実施後、元々 UHF テレビ放送のチャネル 20 以上に割り当てられていた 300MHz 分の無線周波数帯 (400 ～ 700MHz の範囲 ) が売れ残りました。デジタル放送事業者は現在この帯域のごく一部しか使用していません。実に優良な周波数帯が十分に活用されていないという事実を認識した FCC は、数年前から少数のテクノロジ業界大手企業 (Google、Microsoft の Xbox 事業部、Samsung、Dell、 Intel、Philips など）と協力して、通信会社とテレビ放送事業者が 400MHz ～ 700MHz 帯を共有するための現実的な方法の検討を始めました。この構想は「ホワイトスペース」と呼ばれる周波数帯、すなわち放送に実際に使用されるチャネルの間の未使用のチャネルを使って、通信会社と放送事業者に新たなモバイルサービスを提供することを促すものでした ( 図 1 を参照 )。Google や Microsoft などの企業は、このホワイトスペース ( および世界各国の類似のホワイトスペース周波数帯 ) を使って、Wi-Fi の通信範囲をより長距離化して電波を安定させたバージョンを実現し、新たなタイプの通信サービスを提供しようとしています。ザイリンクスの顧客である Adaptrum 社 ( カリフォルニア州サンノゼ ) は、このような新しいサービスを可能にする完全な商用送信 / 受信システムを初めて発売した機器ベンダーです。 Adaptrum 社の設立者兼 CEO である Haiyun Tang 氏は、「ホワイトスペースは全く新しい市場です」と述べています。「現在のホワイトスペースは開拓時代の米国西部によく似た状態です。ホワイトスペースのオープン周波数帯には利用希望者が殺到している一方、標準はまだ進化の途上にあります。」この市場が現れたのは比較的最近のことですが、Adaptrum 社はいち早くそこにチャンスを見出し、長年にわたってホワイトスペース通信機器を開発してきました。Tang 氏はカリフォルニア大学バークレー校でワイヤレス通信の PhD を取得し、コグニティブ無線テクノロジの開発に専念していた経歴があります。当初は米国空軍の SBIR 助成金を受け、2005 年にバークレー校の名誉教授である Bob Brodersen 氏と共同で Adaptrum 社を設立しました。それ以来、同社はベンチャー資金を調達しながら目覚ましい発展を遂げてきました。2008 年から、Adaptrum 社は FCC と協力して TV ホワイトスペースに関するルール制定に参加し、Google や Microsoft などの各社と協力関係を結びました。 2012 年 4 月、同社は機器ベンダーとして初めて、FCC が承認した Telcordia データベースと連携して動作する、FCC 認証取得のテレビ周波数帯ホワイトスペース向けの機器を発表しました。現在同社は、このテクノロジを概念実証から商用化へと進めています。2013 年 11 月、Google の TV ホワイトスペースデータベースを使用する Adaptrum 社の ACRS TV ホワイトスペースソリューションは、FCC の認証を取得しました。

http://japan.xilinx.com/

Amateurs

PROFILES IN XCELLENCE

図 1 – 米国ではホワイトスペースはおおよそ400M～700M の周波数帯に見つかります (上図の青い部分)。 (http://www.ntia.doc.gov/files/ntia/publications/spectrum_wall_chart_aug2011.pdf) このシステムの最新バージョンは、ザイリ

によると、「400MHz～700MHz 帯を使用

さはさらに増しました。

ンクス Kintex ® -7 FPGA をベースにしてい

する TV ホワイトスペース機器は、20 メガ

「放送チャネルの数と各チャネルが使用す

ます。

ビットのデータレートで送信を始めますが、

る周波数は、日ごと、地域ごとに変わります」

ACRS は、ポール、建物の外壁、山などに

数フィート先ではなく数マイル先でもデータ

と Tang 氏は述べています。「さらに、さま

設置された従来の基地局クラスターに取り

レートは低下しません。」

ざまな企業がホワイトスペース機器で利用

付け可能なランチボックスサイズのベース

Tang 氏の考えでは、Wi-Fi とモバイルサー

できる周波数帯のさまざまな部分を使用して

ユニットと、消費者が自宅に設置する (デス

ビスが利用可能な地域では、サービスプロバ

いるため、機器には高い柔軟性と確実性が

クトップルーターやモデムとほぼ同じサイズ

イダーが接続を安定させるための追加サービ

求められます。」

の) 住宅用レシーバーで構成されます (図 2

スとしてこの新しいテクノロジを提供できま

Tang 氏によると、ホワイトスペース機器

を参照)。このシステムにより、サービスプロ

す。一方、農村地域や開発途上国、特に有線

ベンダー各社は、これらの課題に対処するた

バイダーは、6MHz の帯域幅を利用しておよ

ネットワークや衛星ブロードバンド通信の導

め、おもに、次のいずれかの方式を採用した

そ 20 メガビット (1Hz 当たり 3 ビット) の

入が経済的でない地域では、ホワイトスペー

システムを開発しています。データベースア

接続サービスを提供できます。このサービス

ス方式でメインのデータサービスを提供する

プローチと呼ばれる第 1 の方式では、プロ

は Wi-Fi ほど高速ではありませんが、通信範

ことも考えられます。

バイダーが ( 米国内のテレビ放送のための )

囲は Wi-Fi よりはるかに長距離です。

伝搬モデルを使用して各放送塔のカバーエ

実用的な商用ソリューションを開発するに

リアの等高線図を決定します。この等高線図

帯域の優れた伝搬特性にあります」と Tang

は、各種規制を遵守した形でホワイトスペー

の外側は、ホワイトスペース通信機器が自由

氏は述べています。「テレビ放送の電波は樹

スを使用しながら、現在の消費者が期待し

に使用できることになります。

木や壁に遮られず、山を乗り越えて届きま

ているコスト水準で十分な性能を保証しな

センシングと呼ばれる第 2 の方式では、

す。従来の Wi-Fi ベースのモバイルサービ

ければなりません。これを実現するために、どのチャネルが利用可能かを機器がオンザフ

スは、樹木や壁などの一般的な障害物に妨

Adaptrum 社は複雑な技術的課題を解決す

げられることがあります。Wi-Fi トランスミッ

る必要がありました。まず Adaptrum 社は、ホワイトスペース機器はどのチャネルが使用

ターのすぐ近くでは 300 メガビットのデー

同社のシステムが信号の送受信に使用する

中でどのチャネルが使用されていないかを

タレートを利用できますが、トランスミッ

周波数帯が、認可を受けたデジタル放送と全

常に検出し、どのチャネルが通信に利用でき

ターから遠ざかり、数枚の壁で隔てられると、

く干渉しないようにする必要がありました。るかを判断します。しかし、Tang 氏による

このデータレートは急激に数メガビットま

また、放送に使用されていない 400MHz ～

で低下し、接続が途切れることもあります。

700MHz 帯の一部は、スポーツイベント、を取得している手法はデータベース方式のみ

400MHz～700MHz 帯の電波ははるかに

教会、ナイトクラブなどで使用されるワイヤ

です。「FCC はセンシング方式に基づいたホ

安定しています。この帯域の優れた伝搬特性

レスマイクや、MRI のように電波を使用す

ワイトスペース機器をまだ完全にテストして

により、私たちは通信範囲が最大 5 マイルの

る医療機器など、ほかの機器によってランダ

おらず、100% の信頼性を検証していない

機器を提供できます。」その結果、Tang 氏

ムに占有されている可能性があるため、複雑

ため、現時点ではデータベース方式がデフォ

波数帯を放送用に選んだ理由の 1 つは、この

FCC からテレビ放送データを毎日収集し、

法令遵守と性能の確保

「放送事業者が 1950 年代にこの無線周

14 Xcell Journal 86 号

ライで自律的に検出します。この方式では、

と、現時点で FCC によって検証され、認証

PROFILES IN XCELLENCE

ルトの手法になっています」と Tang 氏は述

表されているこの標準の通信範囲は最小で

軟性に優れた Kintex-7 All Programmable

べています。

も 10 マイル、最大データレートは 6MHz

FPGA を使用しています。刻々と変化する

Adaptrum 社のシステムはデータベース

の帯域幅で 20 メガビット (1Hz 当たり 3

設計仕様に応じてデバイスのデザインを変更

方式を採用しており、毎朝各基地局は、特

ビット ) です。」一方、これと競合する IEEE

し、標準が確定した段階でデザインをさらに

定の日に各ローカル局が放送に使用する周

標準 (802.11AF) は、TV ホワイトスペー

調整できる機能は、私たちには本当に有益で

波数帯に関する更新されたデータベースを

スを従来の Wi-Fi 運用に使用しようとするも

す」と Tang 氏は述べています。

( たとえば米国市場向けには FCC から ) ダ

のです。「まだ初期段階であり、どの標準が

Tang 氏によると、Kintex-7 FPGA では

ウンロードします。

市場に採用されるかを確実に予想できる人は

最大限に再プログラムが可能なため、このデ

FCC は、データベースサービスプロバ

誰もいません」と Tang 氏は述べています。バイスの柔軟性はサービスプロバイダーに

イダーとして Telcordia (Ericsson)、Spec- 「しかし、ホワイトスペースが提供する通信

システムを売り込む際に役立つはずです。そ

trum Bridge、最近では Google など少数

範囲と、大都市圏の外側ではさらに広い周

れは、サービスプロバイダーがホワイトス

の企業のみを認定しています。Google は、波数帯が利用可能であるという事実のため

ペース通信サービスを顧客に販売した後で

同社のサービスを世界中でより広く利用で

に、ホワイトスペースへの期待は高まってい

も、この FPGA は再プログラムとアップグ

きるようにする手段として TV ホワイトス

ます。」

レードが可能であるからです。システムを現

ペースを利用したいようです (http://www.

サービスプロバイダーの形成は初期段階

場でアップグレードできるので、通信事業者

google.org /spectrum /whitespace/

であり、標準もまだ策定中であるため、現

は長期にわたってオンザフライでの機能の追

channel/ を参照 )。

時点でホワイトスペース機器 ( トランスミッ

加や強化が可能です。このようにして、通信

また、ホワイトスペースの最適な使用方

ターおよびレシーバー ) を開発している企

事業者は「より高い価値のプランを顧客に販

法を定義する多くの新しい標準が策定され、業はわずか数社 ( 大半は新興企業 ) にすぎ

売するか、または既存のプランにサービスを

互いに競合しています。たとえば、IEEE

ません。しかし、Adaptrum 社は他社の一

追加するか」の機会を手に入れます。「この

802.22 はリージョナルエリアネットワー

歩先をリードしているようです。その理由の

プラットフォームは、固定されたハードウェ

クの標準を定義するものです。「その目標は、 1 つは、同社がザイリンクスの 7 シリーズ

アソリューションよりもはるかに大きな価値

従来の Wi-Fi よりも長距離の接続を提供す

FPGA を採用していることです。「Adaptrum

をもたらすことを実感しています」と Tang

ることです」と Tang 氏は述べています。「公

社のトランシーバーソリューションには、柔

氏は述べています。

図 2 – ACRS 2.0 は、戸外での使用を想定して密閉して耐久性を高めた、アルミニウム製のシェル構造を備えています。この機器はポールまたは壁に取り付け可能で、イーサネットケーブルを介して電源が供給されます。

http://japan.xilinx.com/

ASK FAE-X

Median Filter and Sorting Network for Video Processing with Vivado HLS

Vivado HLS ツールを使用したビデオ処理用の Median フィルターとソーティングネットワーク Daniele Bagni DSP Specialist Xilinx, Inc. daniele.bagni@xilinx.com

16 Xcell Journal 86 号

ASK FAE-X

Vivado ツールの

自動車からセキュリティシステムやハンドヘルド機器に至るまで、

高位合成機能は、

す。これらの製品は世代ごとに機能の強化と画質の向上が要求さ

エンベデッドビデオ

はありません。筆者は DSP デザインを専門とするザイリンクスの

アプリケーション用ソーティングネットワークのデザイン向上を支援します。

内蔵ビデオ機能を採用するアプリケーションの数は増え続けていまれますが、設計チームにとって、優れた画質を実現するのは簡単でフィールドアプリケーションエンジニアとして、効果的なビデオフィルタリングのための IP コアおよび手法についてしばしば質問を受けています。新しい Vivado ® Design Suite の高位合成 (HLS) 機能を使用すれば、ソーティングネットワークをベースとした非常に効果的な Median フィルタリング手法を、どのザイリンクス 7 シリーズ All Programmable デバイスにも簡単にインプリメントできることがわかりました。この手法を詳しく説明する前に、イメージに生じるノイズに関して設計者が直面する問題と、こうした問題の解決に使われる一般的なフィルタリング手法について検討します。デジタルイメージのノイズは、一般的にシステムがイメージの取り込みまたは送信を実行しているときに発生します。たとえば、スキャナーまたはデジタルカメラのセンサーや回路が各種のランダムノイズを発生することがあります。通信チャネルのランダムビットエラーまたはアナログデジタルコンバーターのエラーは、「インパルス性ノイズ」と呼ばれる特に厄介なタイプのノイズの原因となります。この種のノイズは、イメージの表面のランダムな白または黒の点としてディスプレイ上に現れ、画質の深刻な低下を招くため、「ソルト＆ペッパーノイズ ( ごま塩ノイズ )」とも呼ばれます ( 図 1)。ビデオ技術者は、イメージのノイズを軽減するため、通常はデザインに空間フィルターを適用します。これらのフィルターは、イメージ内のレンダリング状態の良くないピクセルを、そのノイズピクセルの周囲のピクセルの良好な特性または値によって置き換え、または強化します。空間フィルターには、主に線形フィルターと非線形フィルターの 2 種類があります。最もよく使用される線形フィルターは、平均フィルターと呼ばれます。このフィルターは、各ピクセルの値を、隣接するピクセルの平均値で置き換えます。この方法では、レンダリング状態の良くないピクセルは、イメージ内のほかのピクセルの平均値に基づいて改善されます。平均フィルタリングは、ローパス手法を使用して非常に迅速にイメージのノイズを除去します。この処理は高速ですが、しばしばイメージ全体の境界がぼやけるという副次的効果を伴います。ほとんどの場合、線形平均フィルタリングの代替手段として非線形フィルタリング手法を使用すると効果的です。非線形フィルタリングは、インパルス性ノイズの除去に特に優れています。最もよく使用される非線形フィルターは、順序統計フィルターと呼ばれるものです。非線形順序統計フィルタリングの最も一般的な手法が Median フィルターです。 Median フィルターは優れたノイズリダクション効果を持ち、同じサイズの線形スムージングフィルターに比べてイメージがぼやけることがずっと少ないため、ビデオ / 画像処理に広く使用されています。平均フィルターと同様に、Median フィルターはイメージ内の各ピクセルを順に検討し、隣接するピクセルを調べて、当該ピクセルが周囲のピクセルを代表しているかどうかを判断します。ただし Median フィルターは、ピクセルの値を隣接するピクセルの平均

http://japan.xilinx.com/

ASK FAE-X

図 1 – インパルス性ノイズの影響を受けた入力イメージ。壊れたピクセルはわずか 2% ですが、画質の深刻な低下を招くには十分です。

図 2 – 3x3 の Median フィルター適用後の同じイメージ。インパルス性ノイズは完全に除去されています。

18 Xcell Journal 86 号

ASK FAE-X

図 3 – 5 つの入力サンプルのソーティングネットワークのブロック図。大きなブロックは (1 クロックサイクルのレイテンシを持つ) コンパレータで、小さなブロックは遅延要素です。値で置き換える代わりに、隣接するピクセルの中央値で置き換えます。中央値は必ず隣接するいずれかのピクセルの値になるため、 Median フィルターは境界をまたぐときに新しい非現実的なピクセル値を生成しないので、境界がぼやけるという平均フィルターの副次的効果を回避できます。この理由で、 Median フィルターは、鋭い境界を維持する能力でほかのフィルターよりはるかに優れています。Median フィルターは、中央値を計算する際に、まず周囲のウィンドウから得られるすべてのピクセルを数値の順に並べ替え、次に検討中のピクセルを中央ピクセル値で置き換えます ( 検討中の隣接領域に偶数のピクセルが含まれる場合は、2 つの中央ピクセル値の平均を使用します )。たとえば、次の値を持つ 3x3 ピクセルウィンドウの中心に、値 229 のピクセルがあるとします。 39

83 225

5 229 204 164

これらのピクセルを値の順に並べると、ソートされたリスト 5 39 57 61 83 164 204 225 229 が得られます。したがって、中央値は中央の値、すなわち 83 です。出力イメージ内では元の値 229 はこの値で置き換えられます。図 1 のノイズの多いイメージに 3x3 の Median フィルターを適用したときの効果を図 2 に示します。フィルターが適用されるピクセルの周囲のウィンドウが大きいほど、フィルタリングの効果は明瞭になります。

#define KMED 3 // KMED can be 3, 5, 7, Ö #define MIN(x,y) ( (x)>(y) ? (y) : (x) ) #define MAX(x,y) ( (x)>(y) ? (x) : (y) ) #ifndef GRAY11 typedef unsigned char pix_t; // 8-bit per pixel #else #include <ap_int.h> typedef ap_int<11> pix_t; // 11-bit per pixel #endif pix_t median(pix_t window[KMED*KMED]) { #pragma HLS PIPELINE II=1 #pragma HLS ARRAY_RESHAPE variable=window complete dim=1 int const N=KMED*KMED; pix_t t[N], z[N]; char i, k, stage; // copy input data locally for (i=0; i<KMED*KMED; i++) z[i] = window[i]; // sorting network loop for (stage = 1; stage <= N; stage++) { if ((stage%2)==1) k=0; if ((stage%2)==0) k=1; for (i = k; i<N-1; i=i+2) { t[i ] = MIN(z[i], z[i+1]); t[i+1] = MAX(z[i], z[i+1]); z[i ] = t[i ]; z[i+1] = t[i+1]; } } // end of sorting network loop // the median value is in location N/2+1, // but in C the address starts from 0 return z[N/2]; } // end of function 図 4 – C で記述されたソーティングネットワークによる Median フィルターのインプリメンテーション

http://japan.xilinx.com/

ASK FAE-X

Median フィルターはノイズリダクション

計する簡単で効果的な手法を利用できるこ

ソーティングネットワークとは

機能が優れているため、たとえばインタレー

とをユーザーに伝えています。Vivado HLS

配列の要素を昇順または降順になるよう

ス方式のビデオ信号でフィールドレートを

ツール [3] を使用すると、Zynq® -7000 All

に並べ替えるプロセスは、ソーティングと呼

50Hz から 100Hz に変換するための動き

Programmable SoC [4] の FPGA ファブ

ばれます。ソーティングは、多くのエンベデッ

補償インターポレーターや、インタレース方

リック上でリアルタイム性能を実現できます。

ドコンピューティングシステムで最も重要な

式からプログレッシブ方式への変換時のエッ

次のレッスンでは、イメージフォーマットは

操作の 1 つです。

ジ指向インターポレーターなど、ビデオス

8 bpp ( ピクセル当たりのビット数 )、1 行

ソーティングは非常に多くのアプリケー

キャンレート変換システムの補間段階にも広

当たり 1,920 ピクセル、1 フレーム当たり

ションで重要な役割を果たしているので、バ

く使用されています。Median フィルターの

1,080 行 ( フレームレート 60Hz) としま

ブルソート、シェルソート、マージソート、ク

詳細な解説をご希望の方は、[1] および [2]

す。したがって、最小ピクセルレートは少な

イックソートなど、よく知られたソーティン

を参照してください。

くとも 124MHz です ( 正確には、1,920

グ手法の複雑性と速度を分析した科学論文

Median フィルターの導入で最も重要な手

x 1,080 x 60 = 124.416MHz)。したがっ

は多数存在します。クイックソートは大量の

順は、生成される出力ピクセルごとにソート

て、実際には 124MHz を多少上回るクロッ

データセットの処理に最適な最も高速のアル

されたピクセルのリストを作成するのに使用

クレートであれば十分なのですが ( 実際の

ゴリズムであり [5]、バブルソートは最も簡

されるランキング手法です。ソーティングプ

ビデオ信号にはブランキングデータも含ま

単なアルゴリズムです。通常、これらのすべ

ロセスには、多くの演算クロックサイクルが

れているため、クロックレートの要件は、ア

ての手法は RISC CPU 上でソフトウェアタ

必要です。

クティブピクセルのみによって要求されるク

スクとしての実行が想定され、一度に 1 つ

Vivado Design Suite では高位合成機能

ロックレートよりも高くなります )、ある種

だけの比較演算を実行します。これらのワー

が提供されています。したがって筆者は、ソー

の設計上の課題を確定するために、Vivado

クロードは一定ではなく、入力データが既に

ティングネットワークと呼ばれる考え方に

HLS ツールのターゲットクロック周波数を

どの程度部分的に順序付けられているかに依

基づいて C 言語で Median フィルターを設

200MHz に設定します。

存します。たとえば、N 個のサンプルセットを順序付けるとすると、クイックソートの演

#define MAX_HEIGHT 1080 #define MAX_WIDTH 1920 #define KKMED 1 // KKMED == 1 for 3x3 window void ref_median(pix_t in_pix[MAX_HEIGHT][MAX_WIDTH], pix_t out_pix[MAX_HEIGHT][MAX_WIDTH], short int height, short int width) {

算の複雑性は、ワーストケース、平均的ケース、ベストケースのシナリオで、それぞれ N2、 NlogN、NlogN になります。一方、バブルソートでは、複雑性はそれぞれ N2、N2、N になります。複雑性の数値に関する見解が統一されていないことは認めざるを得ません。しか

short int r, c; //raw and col index pix_t pix, med, window[KMED*KMED]; signed char x, y;

し、筆者がこのテーマで読んだすべての論文

L1:for(r = 0; r < height; r++) { #pragma HLS LOOP_TRIPCOUNT min=600 max=1080 avg=720

いるようです。このこと自体、代替的な手法

L2:for(c = 0; c < width; c++) { #pragma HLS LOOP_TRIPCOUNT min=800 max=1920 avg=1280 #pragma HLS PIPELINE II=1

if ( (r>=KMED-1)&&(r< height)&& (c>=KMED-1)&&(c<=width) ) { for (y=-2; y<=0; y++) for (x=-2; x<=0; x++) window[(2+y)*KMED+(2+x)]=in_pix[r+y][c+x]; pix = median(window); } else pix = 0; if(r>0 && c>0) out_pix[r-KKMED][c-KKMED] = pix; } // end of L2 } // end of L1

} // end of function

は、ソーティングアルゴリズムの複雑性の計算は容易ではないという点で意見が一致してを探すべき十分な根拠になりそうです。イメージ処理中に出力画像を一定のスループットで生成するには、ソーティング手法内で確定的動作が必要です。したがって、上記のアルゴリズムは、どれも Vivado HLS ツールを使用した FPGA デザインの候補としては不適当です。ソーティングネットワークは、並列実行を使用して実行時間の高速化を実現する方法です。ソーティングネットワークの基本的ビルディングブロックはコンパレータです。コンパレータは、2 つの数値 (a および b) をソートして、最上位の出力に最大値、最下位の出力に最小値を出力し、必要に応じてスワップを実行する簡単なコンポーネントです。古典的なソーティングアルゴリズムに対するソーティングネットワークの利点は、与えら

図 5 – ビデオラインバッファーの動作を考慮に入れない、最初の Vivado HLS コード

20 Xcell Journal 86 号

れた数の入力に対してコンパレータの数が固

ASK FAE-X

定されていることです。したがって、FPGA のハードウェアにソーティングネットワークをインプリメントするのは簡単です。図 3 に、(Xilinx System Generator [6] で設計された ) 5 つの入力サンプルのソーティングネットワークを示します。入力サンプルの値にかかわらず、処理遅延はちょうど 5 クロックサイクルであることに注意してください。また、右側の 5 つの並列出力信号にはソートされたデータが含まれ、最上位の信号に最大値、最下位の信号に最小値が出力されていることに注意してください。図 4 のコードに示すように、ソーティングネットワークを使用した Median フィルターを C 言語でインプリメントするのは簡単です。Vivado HLS の指示子は C コードそれ自体に埋め込まれています (#pragma HLS)。Vivado HLS ツールが最適な RTL コードを生成するには、2 つの最適化指示子が必要です。第 1 の指示子は、出力ピクセルレートと FPGA のクロックレートを一致させるために、関数全体をパイプライン化して初期化インターバル (II) を 1 にします。図 6 – Vivado HLS ツールによる、基本的なリファレンス Median フィルターの性能の推定値 (実質的にトップレベルの関数として使用した場合)。スループットは最適にはほど遠いレベルです。

第 2 の最適化指示子は、個別のレジスタに収まるようにピクセルウィンドウを再構成し、一度に並列ですべてのデータにアクセスできるようにして帯域幅を向上させます。

トップレベルの関数

Median フィルターの基本的インプリメンテーションを図 5 のコードセグメントに示します。このコードをリファレンスとして使用します。任意のクロックサイクルで 1 つの出力ピクセルを生成するために、最も内側のループはパイプライン化されます。レイテンシの推定値を示すレポートを生成するには、ループ L1 および L2 の反復の回数は「制限されていない」ため、これらの (TRIPCOUNT 指示子を使って ) 可能な反復の回数を Vivado HLS コンパイラに指示する必要があります。つまり、このデザインが実行時に 1,920x1,080 ピクセルの最大許容解像度以下のイメージ解像度を処理できるとすると、L1 および L2 ループの上限が ( コンパイル段階ではわかっていない ) 画像の高さと幅になります。この C コードでは、フィルターが適用されるピクセルウィンドウはイメージ内の異なる複数の行にアクセスします。したがって、図 7 – Vivado HLS ツールによる、トップレベルの Median フィルター関数の性能の推定値。フレームレートは 86.4 Hz で、必要な性能を上回っています。

メモリの局所性を利用して必要なメモリ帯

http://japan.xilinx.com/

ASK FAE-X

域幅を抑えられるメリットは制限されます。

void top_median(pix_t in_pix[MAX_HEIGHT][MAX_WIDTH], pix_t out_pix[MAX_HEIGHT][MAX_WIDTH], short int height, short int width) { #pragma HLS INTERFACE ap_vld register port=width #pragma HLS INTERFACE ap_vld register port=height #pragma HLS INTERFACE ap_fifo depth=2 port=out_pix #pragma HLS INTERFACE ap_fifo depth=2 port=in_pix short int r, c; //row and col index pix_t pix, med, window[KMED*KMED], pixel[KMED]; static pix_t line_buffer[KMED][MAX_WIDTH]; #pragma HLS ARRAY_PARTITION variable=line_buffer complete dim=1 L1:for(r = 0; r < height; r++) { #pragma HLS LOOP_TRIPCOUNT min=600 max=1080 avg=720 L2:for(c = 0; c < width; c++) { #pragma HLS LOOP_TRIPCOUNT min=800 max=1920 avg=1280 #pragma HLS PIPELINE II=1 // Line Buffers fill for(int i = 0; i < KMED-1; i++) { line_buffer[i][c] = line_buffer[i+1][c]; pixel[i] = line_buffer[i][c]; } pix = in_pix[r][c]; pixel[KMED-1]=line_buffer[KMED-1][c]=pix; // sliding window for(int i = 0; i < KMED; i++) for(int j = 0; j < KMED-1; j++) window[i*KMED+j] = window[i*KMED+j+1]; for(int i = 0; i < KMED; i++) window[i*KMED+KMED-1] = pixel[i]; // Median Filter med = median(window);

if v( (r>=KMED-1)&&(r<height)&& (c>=KMED-1)&&(c<=width) ) pix = med; else pix = 0; if(r>0 && c>0) // KKMED == 1 for 3x3 window // KKMED == 2 for 5x5 window out_pix[r-KKMED][c-KKMED] = pix;

} // end of L2 loop } // end of L1 loop } // end of function

Vivado HLS ツールはこのようなコードの合成が可能ですが、図 6 に示すように、最適なスループットは得られません。Vivado HLS コンパイラによって自動的に最も内側のループ L2 が完全にアンロールされる結果として、ループ L1_L2 の初期化インターバルは (1 クロックサイクルではなく ) 5 クロックサイクルになるため、これによって得られる出力データレートではリアルタイム性能は得られません。このことは関数全体の最大レイテンシからも明らかです。5 ナノ秒のターゲットクロック周期では、出力イメージの計算に必要なサイクル数は 10,368,020 になり、60Hz を大きく下回る 19.2Hz のフレームレートに相当します。[7] で詳しく説明しているように、Vivado HLS ツールは新しいメモリをユーザーコードに自動的には挿入しません。したがって、 Vivado HLS ツールのユーザーは、RTL を生成する C 言語モデルにビデオラインバッファーの動作を明示的にコーディングする必要があります。新しいトップレベル関数の C コードを図 8 に示します。現在のピクセルの座標 (row, column) が in_pix[r][c] として示されるとすると、フィルターが適用される座標 (r-1, c-1) の出力ピクセルの周囲に、スライドするウィンドウが作成されます。ウィンドウサイズが 3x3 の場合、結果は out_pix[r-1][c-1] になります。ウィンドウサイズが 5x5 の場合は出力ピクセルの座標は (r-2, c-2) になり、7x7 の場合は (r-3, c-3) になることに注意してください。静的配列 line_buffer は、Median フィルター内の垂直サンプルと同じ数 ( この場合は 3) の KMED ビデオラインを格納します。Vivado HLS コンパイラは、C の static キーワードがあるため、この配列を 1 つの FPGA デュアルポートブロック RAM (BRAM) 要素に自動的にマッピングします。わずかな HLS 指示子を使用するだけでリアルタイム性能を実現できます。任意のクロックサイクルで 1 つの出力ピクセルを生成するために、最も内側のループ L2 はパイプライン化されます。入力イメージ配列 in_pix と出力イメージ配列 out_pix は、FIFO ストリーミングインターフェイスとして RTL にマッピングされます。line_buffer 配列は分割されて個別の KMED 配列となり、Vivado HLS コンパイラは各配列を個別のデュアルポート

図 8 – ビデオラインバッファーの動作を考慮に入れた、新しいトップレベルの C コード

22 Xcell Journal 86 号

BRAM にマッピングします。これにより、利

ASK FAE-X

用可能なポート数が増えるため、ロード / ストア操作の数が増えます ( 各デュアルポート BRAM は 1 サイクル当たり 2 つのロードまたはストア操作を実行可能 )。図 7 に Vivado HLS ツールのパフォーマンス推定レポートを示します。今回の最大レイテンシは 2,073,618 クロックサイクルです。5.58ns の推定クロック周期では、86.4Hz のフレームレートが得られます。この値は必要なレートを上回っています。ループ L1_L2 は望んだとおりに II=1 を示しています。KMED ラインバッファーメモリを格納するのに必要な 2 個の BRAM に注目してください。

高位合成によるアーキテクチャの検討

筆者の意見では、Vivado HLS ツールの優れた機能の 1 つは、HLS ツールの最適化指示子または C コードそれ自体を変更することで、さまざまなデザインアーキテクチャや性能のトレードオフを創造的かつ自由に検討できることです。どちらの操作も非常に簡単であり、短時間で行えます。 Median フィルターのウィンドウをもっと図 9 – Vivado HLS ツールによる、スタンドアロン Median フィルター関数の性能の推定値の比較 (ウィンドウサイズが 3x3、5x5、7x7 の場合)

大きくしたい場合は、どうすればいいでしょう。たとえば、3x3 の代わりに 5x5 が必要な場合は、C コードの KMED の定義を「3」から「5」に変更し、Vivado HLS ツールをもう一度実行します。図 9 に、Vivado HLS ツールによるスタンドアロン Median フィルタールーチンの合成の比較レポート ( ウィンドウサイズが 3x3、5x5、および 7x7 の場合 ) を示します。どのサイズでもルーチンは完全にパイプライン化され (II=1)、ターゲットクロック周期を満たします。一方、ソーティングネットワークの動作から予想されるように、レイテンシはそれぞれ 9、25、および 49 クロックサイクルです。明らかに、ソートされるデータの量が 9 から 25、さらに 49 に増えるため、それに従ってリソース使用量 ( フリップフロップおよびルックアップテーブル ) も増加します。このスタンドアロン関数は完全にパイプライン化されているためトップレベル関数のレイテンシは変化しませんが、ウィンドウサイズを大きくするとクロック周波数は多少低下します。ここまで Zynq-7000 All Programmable SoC をターゲットデバイスとして使用する場合についてのみ説明してきましたが、Vivado

図 10 – Vivado HLS ツールによる、3x3 のトップレベル関数の比較レポート (7Z02 デバイス上での 11 ビットイメージの処理と 7K325 デバイス上での 8 ビットイメージの処理)

HLS ツールを使用すると、ほかのターゲット

http://japan.xilinx.com/

ASK FAE-X

デバイスを同じプロジェクトで簡単に検討で

参考資料

きます。たとえば、Kintex -7 325T を使用

1. “Weighted Median Filters: a Tutorial,” Lin Yin, Ruikang Yang, M. Gabbouj, Y. Nuevo, in IEEE Transactions on Circuits and Systems II, Analog and Digital Signal Processing, Volume 43, Issue 3, March 1996, pp 157-192

した場合、同じ 3x3 の Median フィルターデザインを合成すると、2 個の BRAM、1 個の DSP48E、1,323 個のフリップフロッ

Get on Target

プ、705 個のルックアップテーブル (LUT)

2. “Adaptive Window Multistage Median Filter for Image Salt-and-Pepper Denoising,” Weiyang Mul, Jing Jin, Hongqi Feng, Qiang Wang, in Proレートおよびデータレートは 403MHz にな ceedings of 2013 IEEE International Instrumenります。一方、Zynq SoC を使用した場合は、 tation and Measurement Technology Conference 2 個の BRAM、1 個の DSP48E、751 個 (I2MTC), May 2013, pp 1535-1539

の配置配線リソースが使用され、クロック

のフリップフロップ、653 個の LUT が使用され、クロックレートおよびデータレートは 205MHz になります。最後に、( サンプル当たり 8 ビットの代わりに ) サンプル当たり11 ビットのグレーイメージを処理する 3x3 Median フィルターのリソース使用量を確認するには、任意のビット幅の固定小数点の数を指定する ap_ int C++ クラスを適用することにより、pix_ t データ型の定義を変更します。C のプリプロセッシングシンボル GRAY11 を有効にして、このプロジェクトを再コンパイルする必要があります。この場合、Zynq SoC 上の推定リソース使用量は、4 個の BRAM、1 個の DSP48E、1,156 個のフリップフロップ、1,407 個の LUT になります。図 10 に後半の 2 つ (11 ビットと 8 ビット ) の合成例の推定レポートを示します。

作業時間はわずか数日

3. “Vivado Design Suite User Guide: High-Level Synthesis,” UG902 (v2013.2), June 2013 4. “Zynq-7000 All Programmable SoC: Technical Reference Manual,” UG585 (v1.6.1) September 2013 5. S. A. Teukolsky, W. T. Vetterling, B. P. Flannery, W. H. Press, Numerical Recipes in C, the Art of Scientific Computing, Cambridge University Press, 1992, second edition, ISBN 0 521 43108 5 6. “Vivado Design Suite User Guide: Model-Based DSP Design Using System Generator,” UG897 (v2013.2), June 2013 7. F.M. Vallina, “Implementing Memory Structures for Video Processing in the Vivado HLS Tool,” XAPP793 (v1.0), September 2012

Daniele Bagni は DSP のスペシャリストであり、イタリア、ミラノのザイリンクス EMEA に FAE として勤務しています。ミラノ工科大学で量子エ

筆者らは、さまざまなウィンドウサイズお

レクトロニクスの学士

よびさまざまな bpp ( ピクセル当たりのビッ

号を取得後、フィリップ

ト数 ) を指定して、Median フィルターのタ

ス研究所に 7 年間勤務し、リアルタイム

イミングとエリアの推定値をどの程度簡単に

デジタルビデオ処理 ( 主にフィールドレート

生成できるかを確認してきました。特に 3x3

アップコンバーターの動き推定 ) の研究に携

( または 5x5) Median フィルターの場合、わりました。次の 9 年間は STMicroelectroVivado HLS ツールによって自動的に生成さ

nics 社の R&D 研究所でプロジェクトリー

れる RTL が消費する Zynq SoC デバイス

ダーを勤め、VLIW アーキテクチャエンベ

(-1 スピードグレード ) 上のエリアはわずか

デッド DSP プロセッサ向けのビデオコーディ

です。配置配線後の FPGA クロック周波数は

ングアルゴリズムの開発と最適化に取り組む

206MHz (5x5 バージョンでは 188MHz)、傍ら、ミラノ州立大学の客員教授としてマル

実効データレートは 206MSPS (5x5 バー

チメディア情報コーディングの講座を担当し

ジョンでは 188MSPS) になります。

ました。2006 年、彼はミラノのザイリンク

これらの結果を得るためのデザインの総

スセールスオフィスに入社しました。彼の

所要時間はわずか 5 作業日でした。これら

仕事における最も大きなやりがいは、顧客に

の時間の大半は、Vivado HLS ツールそれ

フィージビリティスタディ ( 実現可能性の研

自体の実行にではなく、MATLAB ® モデル

究 ) を提供しながら、多岐にわたる DSP の

と C モデルの構築に費やされました。HLS

アプリケーションと問題点を研究することで

ツールの実行にかかった時間は 2 作業日以

す。プライベートな時間はテニスとジョギン

下でした。

グを楽しんでいます。

24 Xcell Journal 86 号

パートナーの皆様貴社の製品・サービスを Xcell journal 誌上で PR してみませんか？ Xcell Journal は

プログラマブルデジタルシステム開発者へザイリンクスおよびエコシステム製品の最新情報をはじめ、システム／アプリケーションの解説、サービス／サポート情報、サードパーティー各社の製品情報などをお届けしています。現在では日本各地の 10,000 名を超える幅広い

分野のエンジニアの皆様に愛読いただいておりザイリンクスの Webサイトから、無償でダウンロードまたは iPad 対応デジタル版が購読できます。

貴社製品／ソリューションのプロモーションに非常に効果的なメディアです。

広告掲載に関するお問い合わせ先 Xcell Journal 日本語版への広告出向に関するお問い合せは E-mail にてご連絡下さい。

有限会社エイ・シー・シー

sohyama@acc-j.com

Xcell Journal を拡充。新たに Daily Blog を追加

ザイリンクスは、数々の受賞歴がある Xcell Journal をさらに拡充し、エキサイティングな

Xcell Daily Blog（英文）を始めました。このブログでは、コンテンツを頻繁に更新し、技術者の皆様がザイリンクスの製品とエコシステムの多岐にわたる機能が活用でき、

All Programmable システムおよび Smarter System の開発に役立つ情報を提供します。

Recent（最近の記事） n

W ant the Real Skinny on Commercial 3D ICs? Xilinx’s Vincent Tong Forecasts The Future on 3DInCites

S emiWiki’s Luke Miller: FPGA Training is the Key to Success. Xilinx and the Free University of FPGA

F ast-Booting Linux on the Zynq SoC: The 13.5-second Excitement (+/- a hundred msec or so)

Z ynq-7100 All Programmable SoC Voted “Best FPGA” by readers of Electronic Engineering & Product World in China

Z ynq-based ZedBoard + CMOSIS Super35 Image Sensor + Apertus Engineering = Axiom Open 4K Cinema Camera

ブログ : www.forums.xilinx.com/t5/Xcell-Daily/bg-p/Xcell

X P L A N AT I O N : F P G A 1 0 1

Ins and Outs of Creating the Optimal Testbench

最適なテストベンチ作成のノウハウ

26 Xcell Journal 86 号

XPLANANTION: FPGA 101

RTL モジュールや FPGA が要件に適合することを検証するのは手間がかかりますが、このプロセスを最適化して確実に成功させる方法があります。

FPGA や RTL モジュールの検証は時間のかかるプロセスです。検証エンジニアは、仕様の要件と ( モジュールの不具合を引き起こす可能性のある ) コーナーケースの両方について、デザインが適切に機能することを確認する必要があります。この検証は従来、テストベンチ ( デザインのテスト用に作成されるファイル ) を使って行われてきました。しかし、テストベンチは扱い方によって簡単にも複雑にもなります。本稿では、テストベンチをできるだけ簡単に、最大限に活用する方法について説明します。

検証とは検証とは、UUT (Unit Under Test) がデザイン要件と仕様を満たし、意図した目的に適合することを確認する作業です。通常、プロジェクトを先入観

Adam P. Taylor Head of Engineering - Systems e2v aptaylor@theiet.org

なく検討できるように、検証は設計チームとは別のチームが行います。したがって、UUT のデザインと検証は別の技術者が担当するのが普通です。最近の FPGA デザインは大規模で複雑なため、 UUT の性能が仕様に適合することを確認するにはかなりの労力が必要です。したがって、エンジニアリングチームは、プロジェクトの開始時に検証戦略を決めておく必要があります。選択肢には、次の戦術の組み合わせが含まれます。 ●

論理シミュレーションのみ : この手法は、デザインが適切に機能するかをチェックします。

●

論理シミュレーションとコードカバレッジ : この手法は、デザインが適切に機能することと、デザイン内のすべてのコードがテストされていることをチェックします。

●

ゲートレベルのシミュレーション : この手法は、上記の手法と同じようにデザインの機能をテストします。インプリメントされた最終的なデザインからのタイミング情報でバックアノテートされる場合、このタイプのシミュレーションの実行には長時間かかることがあります。

●

静的タイミング解析 : この手法は、最終的なデザインを解析し、モジュールがタイミング性能を達成していることを確認します。

●

フォーマル等価性チェック : このテクノロジを使用して、RTL ファイルに対するネットリストの等価性をチェックします。

検証戦略の選択にかかわらず、エンジニアリングチームは、個々のモジュールと最終的な FPGA の検証方法、および対象となるすべての要件を示すテスト計画を作成する必要があります。

http://japan.xilinx.com/

XPLANANTION: FPGA 101

セルフチェック型テストベンチ

ションテストと呼ばれるプロセス ) がはるか

場合であり、コーナーケースはすべての入力

UUT のシミュレーション用に作成される

に短い時間で完了します。

が極端な値になる場合です。これらの状況

テストベンチは、セルフチェック型または非

の格好の例として、2 つの値を加算して結果を生成する簡単な 16 ビット加算器を考えま

チェック型を選んだ場合は、コンピューター

コーナーケース、境界条件、ストレステスト

モニター上でテスト結果を表示して、テスト

テストベンチを使用する際は、モジュール

図 2 に示します。

ベンチが希望どおりに機能することを視覚的

の性能が機能的要件を満たすこと、すべての

図から明らかなように、コーナーケースは、

に確認する必要があります。セルフチェック

コーナーケースが検証されていること、( さ

入力が A = 0 かつ B = 0 の場合、A = 0

型テストベンチが従来のテストベンチと異な

らに重要な条件として ) テストベンチによっ

かつ B = 65535 の場合、A = 65535 か

る点は、図 1 に示すように、スティミュラス

て UUT のコードが網羅的にテストされてい

つ B = 65535 の場合、A = 65535 かつ

を適用することだけでなく、予想される結果

ることの 3 点を確認することが目標となり

B = 0 の場合の 4 つです。境界条件はこれ

と対照して UUT からの出力をチェックする

ます。したがって、デザインモジュールの

らのコーナーケースの間の値です。

ことです。これにより、UUT の合格 / 不合

検証時には、UUT モジュールの内容が既知

アプリケーションによっては、通常動作の

格をカテゴリ別に記述できます。この機能

であり観察可能である「ガラス箱テスト」の

上側に、あるいはそれを超えてマージンがあ

と、テキストファイルによる制御およびレポー

手法を使用するのが一般的です。対照的に、ることを確認するために、UUT のストレス

ティングを組み合わせれば、非常に強力な検

UUT が FPGA の場合は、トップレベルで

テストを実行する必要があります。ストレス

証ツールを作成できます。

の検証とシミュレーションの所要時間が長く

テストの内容はモジュールに応じて変わりま

セルフチェック型テストベンチには多くの

なるため、トップレベルのブラックボックス

すが、これにはバッファーと FIFO をオーバー

セルフチェック型のいずれかです。非セルフ

す。この場合の境界条件とコーナーケースを

フローさせようとする反復動作が含まれま

利点があります。慣れないユーザーにとって、テストを使用します。シミュレーション波形を視覚的に検証するこ

要件に対するデザインの機能を検証する

す。デザインのストレステストで UUT を壊

とは非常に時間のかかる難しい作業です。セ

には、テストベンチは、モジュールが動作中

すのは、検証技術者のささやかな楽しみです。

ルフチェック型テストベンチでは、この労力

に遭遇すると予想されるものと同じ種類のス

を軽減できます。また、セルフチェック型テ

ティミュラスを適用する必要があります。し

コードカバレッジ

ストベンチは全体的な合格 / 不合格レポート

かし、機能が要件に適合することを証明する

検証チームには、テストベンチが UUT を

を生成できるので、これを保存しておけば、ためにすべての可能な入力をテストしていた

適切にテストしていることを確認するための

デザインフローの後半でテストの証拠として

のでは、時間がかかりすぎます。この理由で、測定基準が必要です。この測定基準は通常、

利用できます。後の段階で UUT の反復デザ

技術者は通常、ある種の標準的な動作値の

コードカバレッジを使って UUT が正しく

インが必要になった場合、従来型のテストベ

テストと、境界条件およびコーナーケースに

テストされていることを確認することで与え

ンチを使用した場合に比べて、テストベンチ

焦点を絞ります。

られます。コードカバレッジを調べるには、

の再実行と合格 / 不合格の判定 ( リグレッ

境界条件は 1 つの入力が極端な値になる

若干のパラメーターを考慮に入れる必要があ

Stimulus

Stimulus File

UUT

Results

Stimulus

Testbench

図 1 – セルフチェック型のテストベンチアーキテクチャ

28 Xcell Journal 86 号

Result File

XPLANANTION: FPGA 101

テスト関数とプロシージャ

ります。 ●

各実行可能ステートメントを調べて、何回実行されるかを確認する。

●

起こり得るすべての IF、CASE、およびコード分岐内の条件と下位条件をテストし、どのような条件でその分岐が真になる

●

準化された結果レポート形式。ロギング関

プロジェクトやほかのプロジェクトに利用で

数によって得られる要件の検証の証拠は、

きる、よく使用されるテストルーチンのライ

法令遵守の証明にも使用できます。

ブラリがあると、開発作業を迅速化できるだけでなく、テストベンチから標準化された出力が得られます。この標準化された出力は、

かを確認する。

モジュールの解析と検証のいずれにも役立ち

HDL を通るすべてのパスを検証し、通過

ます。

しないパスを特定する。

これらの標準的な関数とプロシージャは、

VHDL プロセスのセンシティビティリス

多くのアプリケーションに使用できます。よ

ト内の信号および wait 文をモニターし、

く使用される手法には、次のものがあります。

起こり得るすべてのトリガー条件がテスト

●

されていることを確認する。

スティミュラスジェネレーター : たとえば、リセットの印加およびリリースのテスト、

上記のパラメーターで 100% を達成しても、UUT が機能的要件を満たすことが証明されたわけではありません。しかし、これに

●

ドのみを対象とすることに注意してください。

●

号属性「stable」、「delayed」、「last_value」、および「last_event」を利用できます。これらの属性は、メモリに必要なタイミングインターフェイスまたはほかのインターフェイスと UUT の適合性を確認する際に非常に重要です。これらの関数は、UUT のセットアップ / ホールドタイム達成の確認と、未達成の場合の違反の報告にも便利です。

ビヘイビアーモデル

場合によっては、UUT と同じ機能をイン

関する標準的手法

プリメントした合成不可能なビヘイビアーモ

出力チェック : 予想される結果に対する出

デルに対して、UUT の性能を検証できます

たはファイルによるレポーティング

のセクションを簡単に特定できます。ここで、

質の良い出力チェック関数は、VHDL の信

または通信インターフェイスの駆動などに

力結果のチェックと、トランスクリプトま

よってテストベンチがテストしていない UUT コードカバレッジは UUT 内で使用するコー

ロギング関数 : 解析を簡単にするための標

検証チームは、チームの全メンバーが当該

ブラリを作成する必要があります。このライ

SELECT 分岐を実行する。 ●

●

モデル : FPGA またはモジュールの動作中にインターフェイスするデバイスの標準化されたモデル

( 図 3 を参照 )。このモデルと UUT にテストベンチから同じスティミュラスを与えて、2 つのモジュールの出力をサイクルごとに比較し、モデルと UUT が同じ挙動を示すことを確認します。適切な結果の比較ができるよう

B 65535, 65535 Corner Case

Boundary Condition

A 0,0

0,65535 図 2 – 16 ビット加算器の境界条件とコーナーケース

http://japan.xilinx.com/

XPLANANTION: FPGA 101

に、このモデルまたはテストベンチは、UUT

タが VHDL 2008 をサポートしている場合

使用してツールを制御することも検討する必

のレイテンシを補正しなければならない場合

は ) std_logic および std_logic_vector を

要があります。この手法では、GUI 内で設定

があります。

使用できます。シミュレータがまだ VHDL

されるすべてのオプション、およびシミュレー

2008 をサポートしていない場合は、同様

ションの各実行の間の変更が、シミュレー

TextIO ファイルの使用

のサポートを提供する ( 標準的ではないがよ

ションを制御する Tcl ファイル内で定義され

VHDL を使用してデザインを検証する場合

く使用される ) std_logic_textio パッケージ

るため、プロセスの反復可能性が向上します。

は、TextIO パッケージを使ってテキストファ

をいつでも利用できます。Verilog もテキス

また、これらのファイルはセルフドキュメン

イルからスティミュラスベクターを読み出し、トファイルの読み出しと書き込み用の同種の合格 / 不合格を含む結果を結果テキストファツールを備えています。

トファイルになり、UUT の検証のサポート

イル内に記録できます。検証エンジニアリン

に必要なドキュメントが削減されます。

グチームは、UUT テスト用の複数のスティ

その他の考慮事項

テスト計画とインフラストラクチャ

ミュラステストファイルを作成できます。テ

テストベンチには時間に依存しない性質が

デザインの検証は、インプリメント可能な

キストファイルを更新するだけで簡単にス

必要です。すなわち、テストベンチは、RTL

デザインそれ自体の作成よりも大きな作業に

ティミュラスを変更できるので、この手法は

またはビヘイビアー UUT のテストと、SDF

なる可能性があり、しばしば実際にそうなり

非常に有益です。これにより、簡単で迅速な

タイミング情報でバックアノテートされる配置

ます。プロジェクトライフサイクルの初期段

アップデートが可能になり、問題を引き起こ

配線後のネットリストのテストを実行できな

階で検証戦略を入念に検討しておけば、設

す可能性のあるシナリオをラボ内または最終

ければなりません。ゲートレベルでのシミュ

計チームと検証チームは、この重要なプロセ

的なハードウェア上でテストする機能も得ら

レーションは ( 要求される分解能が高いため)

スのサポートに必要なテスト計画とインフラ

れます。

かなりの時間がかかりますが、場合によって

ストラクチャを正しく準備できます。本稿で

VHDL 内では、STD テストパッケージ

は必要になります。

説明した事項を考慮に入れることで、目前の

がテキストファイルの読み出しと書き込み

また、検証チームは、シミュレーションツー

作業に十分な柔軟性を備えたテストベンチを

をサポートしており、( ご使用のシミュレー

ルがテストを実行するとき、Tcl スクリプトを

作成する手助けにできます。

Stimulus

Model

Results

Checking

Stimulus

UUT

Results

Stimulus Stimulus File

Results

Testbench

図 3 — UUT とモデルの対照チェック

30 Xcell Journal 86 号

Result File

ハードウェア、ソフトウェア、I/O がプログラマブルなSoC

詳細はこちら

■東京エレクトロンデバイス(株) TEL(045)443-4016 x2web@teldevice.co.jp ■アヴネット・インターニックス(株) TEL(03)5792-8210 EVAL-KITS-JP@avnet.com ■(株)ＰＡＬＴＥＫ TEL(045)477-2005 nfo_pal@paltek.co.jp ■新光商事 (株) TEL(03)6361-8086 X-Pro＠shinko-sj.co.jp

X P L A N AT I O N : F P G A 1 0 1

How to Add an RTOS to Your Zynq SoC Design

Zynq SoC デザインに RTOS を追加する方法 Adam P. Taylor Head of Engineering—Systems e2v aptaylor@theiet.org

32 Xcell Journal 86 号

XPLANANTION: FPGA 101

ザイリンクス Zynq® -7000 All Programmable SoC 内

Zynq All Programmable SoC を最大限に活用するには、オペレーティングシステムが必要です。ここではリアルタイム

OS ( 具体的には μC/OS-III) のインストール方法を説明します。

のプロセッシングシステムを最大限に活用しようとするとき、オペレーティングシステムは単なるベアメタルソリューションを超える効果をもたらします。Zynq SoC デザインの開発者は誰でも、多くのオペレーティングシステムの中から最適な OS を選択できます。最終アプリケーションによっては、リアルタイム OS を選ぶこともあるでしょう。人身事故の防止や厳しい性能目標の達成のために高速な応答と高い信頼性が要求される、産業、軍事、航空宇宙などの苛酷な環境で Zynq SoC を使用する場合は、RTOS が最善の選択肢と言えます。本稿では、Zynq SoC システムに RTOS を上手に追加する方法を実際に体験できるように、最も一般的なリアルタイムオペレーティングシステムの 1 つである Micrium 社の μC/OS-III を使用します。この RTOS またはその旧バージョンは、Curiosity 火星探査機など、さまざまな非常に興味深いシステムに採用されてきました。最新バージョンは現在、MISRA-C、DO178B Level A、SIL3/4、および IEC61508 の各標準の認証審査中であり、多くの Zynq SoC ユーザーに幅広くアピールするはずです。インプリメンテーションの詳細を検討する前に、リアルタイムオペレーティングシステムの基本を確認しておきましょう。

リアルタイムオペレーティングシステム (RTOS) とはリアルタイムオペレーティングシステムと標準的なオペレーティングシステムの違いは何でしょうか。リアルタイムオペレーティングシステムは確定的な性質を持っています。これは、システムが定義済みのデッドラインの範囲内で応答するという意味です。この確定的な性質は、さまざまな理由で重要とされます。たとえば産業用制御システムでそうであるように、最終アプリケーションが産業用プロセスを監視しており、指定された時間内にイベントに応答しなければならない場合は、確定的な性質が必要です。 RTOS は、これらのデッドラインへの対応力に基づいてさらに分類されます。RTOS はハード RTOS、ファーム RTOS、ソフト RTOS の 3 つのタイプに分類され、それぞれが異なる方法でデッドラインの概念を扱います。ハード RTOS では、デッドライン違反はシステムの故障と見なされます。これとは異なり、ファーム RTOS では、ときおり発生するデッドライン違反は許容範囲内とされます。ソフト RTOS では、デッドライン違反があると、結果の有効性は低下しますが、システム全体としてはこれを許容します。リアルタイムオペレーティングシステムは、複数のタスク ( プロセスとも呼ばれる ) の実行の概念を中心として議論されます。それぞれのタスクは要求された機能を実行します。たとえば、インターフェイスを介してデータを読み出すタスクや、そのデータに操作を実行するタスクがあります。1 つのタスクのみを実行する簡単なシステムもありますが、通常、プロセッサ上では一度に複数のタスクが実行されます。これらのタスク間の切り替えは、「コンテキストスイッチング」と

http://japan.xilinx.com/

XPLANANTION: FPGA 101

呼ばれます。タスクを切り替えるには、各タ

へのアクセスをどのように管理するかは非常

として知られています。プロセスはセマフォを

スクに関連付けられたプロセッサのステート

に重要です。管理が適切でないと、「デッド

待機 (WAIT) します。リソースが利用可能な

をタスクスタックに格納し、また追加する必

ロック」や「スタベーション」と呼ばれる問

場合は、このプロセスにはそのリソースの制

要があります。

題が発生し、システムの故障を引き起こすお

御が与えられ、完了するまで実行し、その時

次にどのタスクを実行するかを決めるプロ

それがあります。

点で完了を通知 (SIGNAL) します。しかし、

セスは、カーネル ( ソフトウェアからの入力 /

デッドロックは、あるプロセスが 1 つのリ

プロセスがセマフォを待機 (WAIT) したとき

出力要求を管理し、それらの要求をプロセッ

ソースを保持したまま、そのリソースを解放

にリソースが既に占有されていた場合は、リ

サの中央演算処理装置および機能的要素に対

できないときに発生します。解放しないのは、ソースが利用可能になるまでプロセスはサス

するデータ処理命令に変換する RTOS のコ

このプロセスが現在ほかのプロセスによって

ペンドされます。現在実行中のプロセスが終

ア ) によって制御されます。タスクスケジュー

保持されている別のリソースを要求している

了すると、リソースはすぐに利用可能になると

リングは、特にデッドロック (2 つ以上のタス

ため、自分のタスクを完了できないからです。はいえ、このプロセスがより優先順位の高い

クが互いにロックアウトしている状態 ) を避

システムは無期限にこの状態にとどまるため、プロセスによって先取りされていると、待ち時

けたい場合には複雑になります。これにはタ

アプリケーションはデッドロックに陥ったと言

間が長くなります。優先順位の逆転を防ぐた

イムシェアリングとイベントドリブンの 2 つ

われます。おわかりのように、デッドロックは

めに、mutex (「mutual exclusion ( 相互排

の基本的手法があります。タイムシェアリン

リアルタイムオペレーティングシステムが陥

除 )」に由来する ) と呼ばれる特殊なクラスの

グ方式では、各タスクがプロセッサ上の専用

る不適当な状況です。

バイナリセマフォがしばしば使用されます。

タイムスロットを取得し、優先順位の高いタ

スタベーションは、あるプロセスが必要と

カウンティングセマフォはバイナリセマ

スクには複数のタイムスロットが割り当てら

するリソースが常にほかのプロセスに割り当

フォと同じように機能しますが、特定タイプの

れます。このタイムスライシングは、定期的

てられているため、プロセスを実行できない

リソース ( データストアなど ) のインスタン

な割り込みまたはタイマーによって制御され、ときに発生します。

スが 2 つ以上利用可能なときに使用されま

「ラウンドロビン ( 総当たり ) スケジューリン

この問題については、長年にわたって多く

す。各リソースがプロセスに割り当てられるた

グ」とも呼ばれます。イベントドリブン型のソ

の論文が執筆され、デッカーのアルゴリズム

びにカウントが減り、これが利用可能な状態

リューションでは、高い優先順位を持つタス

( 並行プログラミングにおける相互排除問題

で残っているリソースの数を示すことになりま

クの実行が要求されたときにのみ、タスクが

の古典的対策 ) など多くの解決策が提案さ

す。カウントがゼロに達すると、利用可能な

切り替えられます。この方式は「プリエンプ

れていることも当然と言えるでしょう。この

リソースはなくなるため、いずれか 1 つのリ

ティブスケジューリング」とも呼ばれます。

ような状況の解決に最もよく使用される手法

ソースが解放されるまで、要求側のプロセス

はセマフォ ( 手旗信号 ) です。セマフォは、はサスペンドされます。

デッドロック、リソースシェアリング、およびスタベーション

通常はバイナリセマフォとカウンティングセ

複数のプロセスが相互に通信する必要はし

マフォの 2 種類です。

ばしば生じます。プロセス間の相互通信には

2 つ以上のプロセスが同じリソース

通常、各リソースにはバイナリセマフォが

複数の手法を利用できますが、最も簡単な

(UART、ADC、または DAC など ) を使用

割り当てられています。要求側のプロセスは、のは、上述のようにデータストアとセマフォ

する必要が生じた場合、各プロセスはこのリ

リソースが利用可能になるのを待って実行さ

を使用する方法です。もう少し複雑な手法に

ソースを同時に要求することがあり得ます。れます。タスクが完了すると、要求側のプロ

は、メッセージキューがあります。メッセージ

このような状況では、競合を回避するために

セスはリソースを解放します。これらのセマ

キュー方式では、あるプロセスがほかのプロ

アクセスを制御する必要があります。リソース

フォは、一般に WAIT 操作と SIGNAL 操作

セスに情報を送信したいときは、メッセージ

図 1 – デモファイルの場所を示すディレクトリ構造

34 Xcell Journal 86 号

XPLANANTION: FPGA 101

図 2 – オペレーティングシステムの選択をキューに POST します。プロセスがキューからメッセージを受信したいときは、キューに PEND します。したがって、メッセージキューは FIFO (First-In First-Out) メモリのように機能します。

μC/OS-III オペレーティングシステム Micrium 社の μC/OS-III はプリエンプティブな RTOS です。つまり、この OS は常に、実行状態にあるタスクのうち最高の優先順位を持つものを実行します。この OS を Zynq SoC システムデザインに追加するには、最初の手順として、Micrium 社のウェブサイトから μC/OS-III RTOS をダウンロードします。ダウンロードが完了したら、インストールは非常に簡単です。ご使用のコンピュータ上のザイリンクスインストールフォルダーの下の適切なフォルダー ( ディレクトリ ) に、ダウンロードした数個の ZIP ファイルを展開するだけです。 Zynq-7000-ucosiii-bsp.zip という名前の ZIP ファイルを \<XILINX>\ISE_DS\ EDK\sw\lib\bsp\ フォルダーに展開します。このフォルダーの下には、standalone や xilkernel などほかの複数のオペレーティングシステムが格納されています。次に、図 1 に示すように、Zynq-7000-ucosiiidemo.zip という名前の ZIP ファイルを \<XILINX>\ISE_DS\EDK\sw\lib\sw_ apps\ フォルダーに展開します。このフォル

図 3 – μC/OS-III デモの選択

http://japan.xilinx.com/

XPLANANTION: FPGA 101

図 4 – 適切な設定の取得

ダーには、ほかの複数のアプリケーションデ

ります。この XML ファイルを右クリックして、解決されます。

モが格納されています。

[Properties] を表示します。この画面で、図

これらの 2 組のファイルをインストールし

4 に示すように、このファイルの場所を選択し

たら、ソフトウェア開発キット (SDK) 内で

てコピーできます。

筆者がこの「include」ヘッダーファイル

いつでもプロジェクトの作成を開始できます。この場所をコピーしたら、プロジェクト

を追加すると、プロジェクトが構築され、

以前に作成したのと同じベースハードウェア

を右クリックして [Properties] をクリック

ZedBoard 上で期待どおりに実行されまし

を使用しますが、今回はオペレーティングシ

します。見出し [C/C++ General] の下で

た ( 筆者の YouTube ビデオ http://www.

ステムを組み込むので、新しいアプリケーショ

[Paths] および [Symbol] オプションを選択

youtube.com/watch? v=uRB4La5ijrA

ンおよびボードサポートパッケージ (BSP)

します。次に [Import Settings] をクリック

を参照 )。

が必要です。

し、設定ファイルの場所を貼り付けます。

SDK 内で、ベースハードウェアデザイン

また、リポジトリは、以前に追加したライ

以外の開いているプロジェクトをすべて閉じ

ブラリを正しく指している必要があります。この例をアップし稼働させたことで、シス

ます。次に、[File] → [New] → [Application

この設定を確認するには、[Xilinx Tools] →

テムに RTOS が正しくインプリメントされ

Project] オプションをクリックして、新しい

[Repositories] をクリックします。以前に

たことに確信を持てたことと思います。こ

プロジェクトに名前を付け、オペレーティン

μC/OS-III BSP をインストールした場所が表

れで、Zynq SoC へのソフトウェアデザ

グシステム μC/OS-III を選択します ( 図 2

示されるはずです。

インの適切なインプリメントに進むことが

を参照 )。次に、μC/OS-III 用のデモアプリ

UART を使用してデモのステータスを出

できます。ソフトウェアアプリケーション

ケーションを選択します ( 図 3 を参照 )。

力する ( 初期化が完了し、タスクを実行し

が完成し、エンジニアリングチームがそ

完了したら、[Finish] ボタンをクリックし

ていることを示す ) には、BSP の設定下で

のソフトウェアをハードウェア上でテスト

ます。SDK 内でアプリケーションおよびボー

stdin と stdout を UART に設定する必要

する準備ができたら、ベアメタルシステ

ドサポートパッケージ ( このオプションを選

があります。

ムの場合と全く同じ方法でプログラミン

択した場合 ) が作成されます。[Auto Build]

これらの手順を実行すると、プロジェクト

グファイルを作成して (Xcell Journal 英

オプションを選択していた場合、少数のエ

が構築可能になったことを示すメッセージが

語版 83 号の『Zynq SoC ベアメタルソ

ラーが報告されるでしょう。これは、すべて

表示されます。しかし、まだ 2、3 の警告が

リューションを構成する方法』http://issuu.

のプロジェクトリファレンスが適切に設定さ

表示され、ハードウェア上でこのプロジェクト

com/xcelljournal/docs/xcell_ journal_

れている訳ではないからです。これらのプロ

を実行しようとすると、デモに期待している

issue_83/40?e=2232228/2101904

ジェクトリファレンスを適切に設定するには、ような実行性能は発揮されません。これは未

を参照 )、RTOS のアプリケーションをコン

[Project] → [Src] → [Settings] の下に表示

宣言の関数に関する警告のためです。bsp.c

フィギュレーションメモリからブートし、実行

されるデモの設定をインポートする必要があ

ファイルに次の文を追加すると、この問題は

できます。

36 Xcell Journal 86 号

稼働

ウェブセミナー Web Seminar All Programmable FPGA、SoC、3D IC の世界的なリーディングプロバイダーのザイリンクスが提供するプログラマブルロジックからプログラマブルシステムインテグレーションのさまざまな機能と活用方法をご紹介します。コストを抑え、最大のパフォーマンスを実現するための最新情報を手に入れてください。

ニーズに合わせたプログラムを各種取り揃えて好評配信中 !!

New!! 新セミナー登場

Zynq All Programmable SoC を使用した

マルチチャンネルリアルタイムビデオプロセッサの設計

FPGA 入門編

FPGA をこれから始める方に FPGA の全体概要を解説した入門編と、ものづくりにチャレンジする経営者、技術管理者の方へなぜ今 FPGA /CPLD なのかをご説明します。

30分で判る! FPGA入門

15分で判る! FPGA採用理由

ザイリンクス FPGA を使った最先端デザインの設計手法や、さまざまなアプリケーション設計に求められるデザインチャレンジに対するソリューションをご紹介・解説します。 ∼アクセレータでのソフトウェア

Zynq SoC を使用した最先端エンベデッドシステムの設計ボトルネックの解消方法∼

FPGA 活用編

システムレベルセキュリティの強化: All Programmable SoC で OS を超える

Zynq-7000 All Programmable SoC での C コードからコプロセッシングアクセラレーター

7 シリーズターゲットデザインプラットフォームプログラマブルデバイスである FPGA の設計には開発ツールがキーになります。ザイリンクスが提供するユーザーフレンドリーな開発ツールの特徴や使い方、先端設計メソドロジについて解説します。

開発ツール編

次世代FPGA設計手法セミナー PlanAhead デザイン解析ツール ∼ 第1部、第2部、第3部、デモ ∼

AMBA AXI4 テクニカルセミナー FPGA の世界トップシェアを誇るザイリンクスが提案するソリューションや、ザイリンクスの最先端 FPGA の詳細を解説します。

FPGA/SoC 概要編

Zynq-7000 SoC アーキテクチャとエコシステム

28nm ザイリンクス 7 シリーズ FPGA のアジャイルミックスドシグナルテクノロジ

セミナー内容の詳細／ご視聴は今すぐこちらから

http://japan.xilinx.com/webseminar/

X P L A N AT I O N : F P G A 1 0 1

How to Make a Custom XBD File for Xilinx Designs

ザイリンクスデザイン用のカスタム XBD ファイルの作成

独自のザイリンクスボード記述ファイルを作成すれば、開発期間の短縮とデザインプロジェクトの一貫性の維持が可能となります。どのようなボードを設計する場合でも、カスタム XBD ファイルの作成は比較的簡単です。

38 Xcell Journal 86 号

XPLANANTION: FPGA 101

Manish Nalamwar, Scientist “D” Radar Seeker Laboratoryz Research Centre IMARAT Defence Research Development Organization Hyderabad, India nalamwar.manishkumar@rcilab.in

FPGA ベンダーは各種の質の良い評価ボー

ンクスは『Platform Specification Format

ドやアプリケーション固有のボードを提供し

リファレンスマニュアル』で XBD 構文を

ており、それらは FPGA の評価用として、あ

定義しています (http://japan.xilinx.com/

るいはシステム開発の基盤としてさえ利用で

support/documentation/sw_manuals/

きます。しかしデザインプロジェクトによっ

xilinx11/psf_rm.pdf を参照 )。

ては、評価ボード上では提供されていない機

通常、カスタムボードには、シリアル通信

能が必要とされたり、最終システムの小型化

(RS232 および RS422)、アナログデジタ

が要求されたりする場合があります。このよ

ルコンバーター (ADC)、デジタルアナログ

うな場合、設計チームはカスタムボードを作

コンバーター (DAC)、RAM およびフラッシュ

成しなければなりません。

メモリが必要です。ザイリンクスと Avnet 社

ザイリンクスの各評価ボードには、ペリフェ

が提供している各種評価ボードも、これらのラル、ペリフェラルの構成、制御レジスタ、ペリフェラルを備えています。したがって、同およびボード上の FPGA とのピンロックをじコンポーネントを備えたボードを見つけて記述したザイリンクスボード記述 (XBD) ファ

関連する XBD ファイルを検討すれば、カス

イルが付属しています。XBD ファイルは、設

タム XBD ファイルを迅速に開発できます。

計チームの統一性を維持するのに非常に便利

各 XBD ファイルにはボードがサポートす

であり、ボード上にインプリメントされる現在

る FPGA インターフェイスを定義するさまざ

のデザインおよび将来のデザインのための最

まなブロックが含まれており、各ブロックに

善の戦略を定義付けする手助けになります。

は属性、パラメーターおよびポートのリスト

もちろん、カスタムボードを作成する場合

が含まれています。したがって、XBD ファイ

は、ザイリンクスが提供する XBD ファイル

ルの最初のエントリは、グローバル属性コマ

をそのまま利用することはできませんが、独

ンド、ベンダー情報、ボードの名前とリビジョ

自の XBD ファイルの開発に時間をかける価

ン番号、サポート用のウェブ URL、ボードの

値は確かにあります。設計チームは、正しい

短い説明と長い説明で始まります。

方法で準備された XBD ファイルを使用して

XBD ファイルのローカル属性コマンド

プロジェクトを的確に管理し、デバイスドラ

は BEGIN-END ブロックの間で定義され、イバーとファームウェアの開発作業を合理化『Platform Specification リファレンスマできます。幸いなことに、多少の検討と労力ニュアル』で利用可能な特定のフォーマッが必要ではありますが、ボード用のカスタム

トで表現されます。この例では、コンフィ

XBD ファイルは比較的簡単に作成できます

ギャラブルロジックセルとは別にハード

(Vivado Design Suite を使用するユーザー

PowerPC ® 440 コアを搭載したザイリンク

のために、ザイリンクスは Vivado Design

ス Virtex-5FX30T FPGA をターゲットと

Suite バージョン 2014.1 で導入された

する、ISE® バージョン 12.4 デザインツー

Board Manager と呼ばれる新しいユーティ

ルを使用します。

リティ内で強化された XBD 機能を提供し

カスタムボードには、FPGA のほか、デ

ています。詳細は、『Vivado Design Suite

ザインの要件に基づいて、シリアル通信イン

ユーザーガイド』http://japan.xilinx.com/

ターフェイス (RS232、RS422)、ADC、

support/documentation/sw_manuals/

DAC、SRAM などの各種のペリフェラルが

xilinx2013_3/ug898-vivado-embedded-

搭載されているでしょう。シリアル通信の専

design.pdf を参照 )。

門分野に特化した知的設計資産 (IP) ブロッ

本稿では、カスタム XBD ファイル開発の

クを使用して、複数の UART 要件を実現で

1 つの手法を説明します。このサンプルデザ

きます。たとえば、SRAM と FPGA のイン

インの目的で、Virtex -5 FX30T FPGA を

ターフェイスには外部メモリコントローラー

使用するカスタムボード用の XBD ファイル

(EMC) IP コアを使用し、ADC および DAC

を作成します。

と FPGA のリンクには汎用 I/O (GPIO) IP

まず、ザイリンクスとディストリビューター

コアを使用できます。

の Avnet 社が提供しているドキュメントを

このサンプルデザインのために、筆者ら

お読みになることをお勧めします。独自の

は、デバイスデータシートに記載された機

XBD ファイルを作成するには、XBD 構文で

能的要件およびデバイス要件を満たすカスタ

ファイルを記述する必要があります。ザイリ

ム XBD ファイルを準備しました。FPGA へ

http://japan.xilinx.com/

XPLANANTION: FPGA 101

ATTRIBUTE IOTYPE = XIL_CLOCK_V1 PARAMETER CLK_FREQ = 20000000, IO_IS = clk_freq, RANGE = (20000000) # 20 Mhz PORT USER_SYS_CLK = CLK_20MHZ, IO_IS = ext_clk END

TX RX CONTROL

RS422

TX RX CONTROL

RS232

この後に、このファイル内にボードのすべてのペリフェラルを 1 つずつ記述する必要があります (各ペリフェラルブロックのコーディ

A0-A19

FPGA Virtex-5 FX30T

CONTROL D0-D15

ングの詳細は、本稿と組み合わせて使用される PDF 『カスタムボ

SRAM

ード用の XBD のコーディングの詳細』 (http://www.xilinx.com/ publications/xcellonline/xbd_coding.pdf) を参照)。

A0-A2 CONTROL D0-D13

DAC AD7841

デジタルアナログコンバーター

まず、Analog Devices 社のデジタルアナログコンバーター AD7841 から記述します。この DAC は、8 チャネル、3 つのアド

D0-D11 CONTROL

TRANSCEIVER

D0-D11 CONTROL

ADC AD7891

レスライン、および 14 ビットデータラインと、デバイスの機能を扱う数種類の制御信号を備えています。この DAC は、ザイリンクスが提供する GPIO IP コアを使用して FPGA とのインターフェイスをとります。DAC のアドレスライン (A0 ～ A2) はプロセッサのアドレスラインに接続されます。

図 1 – カスタムハードウェアデザインのブロック図

この DAC は、LDACN、CSN、WRN、CLRN の 4 種類の制御信号を備えています。これらの信号は 2 つの方法で構成できます。すなわち、各信号に 1 ビットを割り当てることも、直接的に 1 つの

の入力クロック信号は 20MHz です。プロセッサは 200 MHz で動作し、プロセッサローカルバス (PLB) は 100MHz で動作します。この情報に基づいて、ローカルデバイスドライバーのタイミングが維持されていることを確認できます。図 1 にカスタムハードウェアのブロック図を示します。このカスタムファイルから始めましょう。ファイルはグローバル属性コマンドから始まり、その後にクロック信号が続きます。次のように、この情報はすべてのボードに必須です。

ATTRIBUTE VENDOR = Xilinx Board FX30T ATTRIBUTE NAME = Virtex 5 FX30T ATTRIBUTE REVISION = A ATTRIBUTE SPEC_URL = www.xilinx.com ATTRIBUTE CONTACT_INFO_URL = http://www. xilinx.com/support/techsup/tappinfo.htm ATTRIBUTE DESC = Xilinx Virtex 5 FX30T Custom Platform ATTRIBUTE LONG_DESC = ‘The FX30T board is intended to showcase and demonstrate Virtex-5 technology. This board utilizes Xilinx Virtex 5 XC5VFX30T-FF665 device. The board includes ADC, DAC, RS232, RS422, SRAM, PLATFORM FLASH, CPU Debug (JTAG) and CPU Trace connectors. ‘ BEGIN IO_INTERFACE ATTRIBUTE INSTANCE = clk_1

40 Xcell Journal 86 号

4 ビットレジスタで構成することも可能です。どちらの方法を選ぶかは、ユーザーのアプリケーションでこれらの信号をどのように扱うかによって決まります。この DAC のデータラインは 14 ビット (D0 ～ D13) です。最初のデバイス (DAC) の詳細を XBD ファイル内に記述したら、次にファームウェアの作成に注意を向ける必要があります。デバイスドライバーを開発する際は、データシートとタイミング図を入念に検討する必要があります。タイミング図を図 2 に示します。デバイスのデータシートには、ユーザーがタイミング図を読み取って制御信号を生成する必要があると記載されています。タイミング情報 t0 ～ t11 は、Analog Devices 社のデータシート (AD7841) に厳密に従っています。最初の手順として、信号の方向を out に設定し、対応するアドレスに 1 を書き込むことによって信号を High にします。たとえば次の文によって、LDACN 信号は方向が out に設定され、High にされます。

XGpio_WriteReg(XPAR_DAC_14BIT_CONTROL_ LDACN_BASEADDR,XGPIO_TRI_OFFSET,0x0); //Direction is out XGpio_WriteReg(XPAR_DAC_14BIT_CONTROL_ LDACN_BASEADDR,XGPIO_DATA_OFFSET,1); //Pulled high 各信号間の遅延は、「for」ループあるいは「NOP」命令を用いて達成されます。同じくらい重要なのは、各信号のシーケンシングとセットアップ/ ホールドタイミングです。これらの仕様はデバイスデータシートに記載されています。この例では、プロセッサが 200MHz

XPLANANTION: FPGA 101

A0, A1, A2

t6 CS WR

t3 t4

t7 DATA

VOUT

t10 CLR VOUT

t11 LDAC

図 2 – AD7841 DAC のタイミング図

で動作している場合、1 単位の増加が 5ns に相当します。

通信インターフェイスおよび SRAM インターフェイス

ザイリンクスの XIL UART IP コアを使用

CONVS (0)

して、RS232 および RS422 ドライバー IC とザイリンクス Virtex-5 FPGA のインターフェイスをとります。筆者らは Maxim 社

ECC (0)

t00NV

の 2 つのデバイスを選び、RS422 通信には MAX3079、RS232 通信には MAX3237 を使用しました。また、GPIO IP コアを使用して RS422 IC の制御信号を生成しました。

CB (0)

メモリには Cypress 社のスタティック RAM (CY7C1061BV33 デバイス ) を選び、ザイリンクス外部メモリコントローラー IP

WR (1)

コア (XIL_EMC) を使用して FPGA とのインターフェイスをとりました。この IP コアと XBD ファイルのおかげで、メモリのインターフェイスと制御は簡単でした。筆者らは、デバイスデータシート内でこのデバイスのタイミング制約を確認し、XBD ファイル内に記述しました。選択したデバイスによって、XBD ファイル内で更新する必要があるパラメー

RD (1)

t31 t4

DB0 TO DB11 (I/O)

VALID DATA INPUT

t10 VALID DATA OUTPUT

I=INPUT 0=OUTPUT

ターは異なります。このメモリを処理するにはザイリンクスの IP コアで十分であり、別のデバイスドライバーを用意する必要はありませんでした。

図 3 – AD7891-1 ADC のタイミング図

http://japan.xilinx.com/

XPLANANTION: FPGA 101

ADC のインターフェイスこのデザインでは、( さまざまなセンサーから送られる ) すべての入力アナログ信号の範囲が ±10V であるため、ADC と FPGA のインターフェイスが問題となりました。筆者らは、このサンプルボードの機能的要件を満たすために、Analog Devices 社の AD78911 を選びました。この ADC は、 8 チャネルと 1 つの 12 ビットデータバスを備え、オプションでシリアルインターフェイスとパラレルインターフェイスを選択します。このデザインにはパラレルインターフェイスが最適であることがわかりました。この ADC は 5V 入力で動作しますが、FPGA の I/O 電圧は

「customboard_RevX_vX_X_0.xbd」は、作成された後、次のディレクトリ構造に格納されている必要があります。パスの例 :

C:\Xilinx\12.4\ISE_DS\EDK\board\customboard_ RevX\data\custom\ customboard_RevX_vX_X_0.xbd さらに、どのようなアプリケーションについても、図 4 に示した特定の手順に従ってハードウェア / ファームウェアの開発を進める必要があります。

3.3V であるため、このデザインでは FPGA とのインターフェイスをとるのにトランシーバーが必要でした。以後、このトランシーバーをバッファーと呼びます。このバッファーの一方の側は FPGA に接

DESIGN REQUIREMENTS

続され、もう一方の側は ADC に接続されます。FPGA がバッファーの制御信号を処理します。このデバイスの方向ピンと出力イネーブルピンを注意深く取り扱い、FPGA と ADC の間のデータフローを制御する必要があります。このデバイスの制御信号は 5 ビット

SELECTION OF COMPONENT

レジスタとしてまとめられます。このデバイスの変換終了 (EOCN) 信号は重要であるため、カスタム XBD ファイル内で個別に記述する必要があります。EOCN は、変換が完了し、FPGA が新しいデータを処理できることを示します。

REFER TO DATASHEET

バッファーのインターフェイス

このデザインでは、バッファーとして Texas Instruments 社のレベルシフトトランシーバー (SN74ALVC164245) を選びました。このデバイスは 16 ビット非反転バストランシーバーで、2 つ

CREATE XBD

の個別のポートと電源レールを備えています。このデバイスのポート B は 5V ADC と接続され、ポート A は 3.3V FPGA と接続されます。この構成により、5V から 3.3V へ、また 3.3V から 5V

WRITE FIRMWARE

へ信号を変換できます。方向ピンを Low に設定すると、ポート B からポート A へデータが転送されます。High に設定すると、逆にポート A からポート B へデータが転送されます。ADC からデータを読み出すには、出力イネーブル (OEN) ピンと方向 (DIR) ピンを Low に設定します。

TEST OF FIRMWARE

書き込み操作の際は、方向ピンを High、出力イネーブルピンを Low に設定した状態で、FPGA が ADC にコマンドを発行します。このサンプルデザインでは、バスの競合を避ける目的で、バッファーの出力イネーブルピンは High にされます。このデザインでは 2

図 4 – ハードウェア/ファームウェアの開発プロセス

個のバッファーと 2 個の ADC を使用しました。図 3 は、筆者らが制御信号の生成に使用した、パラレルインターフェイスモードのタイミング図です。t 0 ～ t11 の信号タイミングは、

開発期間の短縮

Analog Devices 社のデバイスデータシートを基準にしています。

カスタムハードウェアを開発する組込み機器設計者にとって、独

このファイルの作成や修正には、Notepad や WordPad などの

自のアプリケーション向けのデバイスドライバーの開発は常に難し

任意のエディタープログラムを使用できます。このファイルは拡張子

い作業です。ザイリンクスは、開発プロセスと開発用の汎用ボード

「.xbd」を付けて保存します。編集の完了時に、このファイルは、新

記述ファイルに関する幅広い資料を用意しています。このボード記

規プロジェクトの作成中に EDK ツールが直接認識できる特定のパス

述ファイルは、独自のカスタムハードウェアの要件に合わせて簡単

に置かれている必要があります。新規プロジェクトを開始するときは、

にカスタマイズおよび修正できます。ハードウェア構成にどのよう

このファイルをカスタムボード用に選択する必要があります。

な修正や変更があっても、1 つのファイルだけに注目し、デバイス

たとえば、「customboard」という名前の仮定上のボードを

に関連するすべての変更をそのファイル内に記述するだけで対応で

EDK ツールが認識できるようにするには、特定のディレクトリ構

きます。このようにして、カスタム XBD ファイルは、生産性の向上

造に従う必要があります。これは非常に重要な手順です。この例の

と開発期間の短縮を実現します。

42 Xcell Journal 86 号

基本のFPGAアーキテクチャ E-Learning ・スライスおよび I/Oリソース・メモリおよびクロッキングリソース・ Architecture Wizard および Foorplan Editor

開発言語

VHDL 基礎

Verilog 基礎

System Verilog での設計

VHDL 中級

Verilog 中級

System Verilog での検証

Vivado デザインツールフロー VivadoでのFPGA設計導入 VivadoでのFPGA設計実践

7シリーズデザイン Chip Scope Pro ツールを使用したデバッグ法 FPGA 低消費電力設計のコツアナログミックスシグナル（AMS）設計

コネクティビティデザイン基礎メモリインターフェイス設計マルチギガビットシリアルIO

DSPデザイン基礎

エンベデッドデザイン基礎

Simlink基礎（MathWorks社開催）

Zynq システムアーキテクチャ

SystemGenerator を使用したDSPデザイン

Zynq エンベデッドシステム開発

Cコードベース設計 : Vivado HLS を使用した高位合成

Zynq エンベデッドシステムソフトウェア開発

Vivado でのアドバンスド FPGA設計

エンベデッドマイクロブレーズ Linux開発

パーシャルリコンフィギュレーションオリジナルトレーニングの内容およびスケジュールは、各社の Web サイトをご覧ください。

ザイリンクス販売代理店 / 認定トレーニングプロバイダ

アヴネット・インターニックス

avnetinternix.co.jp/training.aspx

新光商事

xilinx.shinko-sj.co.jp/training/index.html

東京エレクトロンデバイス

ppg.teldevice.co.jp/

パルテック

www.paltek.co.jp/seminar/index.htm

エッチ・ディー・ラボ

www.hdlab.co.jp/web/x500x/

詳細とご登録はこちらから

Japan.xilinx.com/training/

TOOLS OF XCELLENCE

Selecting the Right Converter: JESD204B vs. LVDS

最適なコンバーターの選択 : JESD204B と LVDS Ian Beavers Applications Engineer High Speed Converters Team Analog Devices, Inc. Jeff Ugalde Product Engineer Interface Technology Group Analog Devices, Inc.

44 Xcell Journal 86 号

TOOLS OF XCELLENCE

最新の高速 FPGA には、

データコンバーターアーキテクチャと

ションではより高いデータレートを利用でき

FPGA のジオメトリの高度化と縮小化が進む

るとはいえ、現在のところ、市販 LVDS コ

新しい JESD204B 標準に

につれて、システム設計者は新しいデータイ

ンバーターで得られる最大データレートは

ンターフェイスの問題に直面します。プロセ

0.8Gbps ～ 1Gbps にすぎません。LVDS

準拠したコンバーターが

スジオメトリの縮小により、広帯域化したコ

テクノロジは、コンバーターの帯域幅への要

ンバーターはより高い分解能と速度で動作で

求に追いつけなくなっています。LVDS は、

最適です。

きるようになり、これがデータスループット

LVDS コアメーカーの業界標準規格である

の向上につながっています。一方、高いシリ

TIA/EIA 644A 仕様によって制御されます。

これらのデバイスを

アル化 / デシリアル化 (SerDes) レートが利

この仕様は、設計者向けのベストプラクティ

用可能になり、大きなジオメトリでは利用で

スガイドとして機能し、さまざまなメーカー

きなかった帯域幅をサポートできるようにな

の LVDS トランスミッターとレシーバーの互

ります。また、実装面積の縮小により、1 つ

換性の確保を促進しています。同じように、

のデバイスに組み込めるデータコンバーター

設計者が LVDS 仕様を完全に遵守せずに開

の数が増えます。したがって、これらのデー

発した製品は、LVDS 仕様に準拠しないので、

タコンバーター向けのインターフェイスソ

市場における互換性の確保がより困難になり

リューションには、高いデータレートへの対

ます。

応、複雑な FPGA デバイスとの互換性の確

LVDS と同様に、JESD204B は、異な

保、公称 I/O 数の維持が求められます。

るメーカーの製品間で相互運用性を確保する

コンバーターの SerDes リンク仕様であ

ための電気的および物理的要件の指針を提

る JESD204B に準拠したインターフェイス

供する標準化団体である Jedec の管理下に

は、最大 12.5Gbps のデータ転送をサポー

置かれています。JESD204B の最大デー

トします。この最大データレートは、65nm

タレートは 12.5Gbps に規定されており、

以下の高度なプロセッシングノードを採用し

実際に使われている LVDS に比べてスルー

た、電力効率が向上したコンバーターで実現

プットが 10 倍以上に向上しています。この

可能です。12.5Gbps のチャネルレートに

高性能により、データコンバーターシステム

より、システム設計者は、従来の低電圧差動

の I/O 要件の軽減およびパッケージサイズ

信号方式 (LVDS) DDR インターフェイスで

の小型化に加え、スタティック消費電力の低

はなく、この新しい SerDes テクノロジの利

減によるシステムコストの大幅な削減が可能

点をフルに活用できます。

となります。

ザイリンクス Virtex -7 ファミリおよび

JESD204B 仕様は AC カップリングを

Kintex® -7 ファミリなどの市販 FPGA モデ

許容しているので、さまざまな電源レベルを

ルは、最大 12.5Gbps 以上のデータレー

使用する各種のテクノロジノードとの互換性

トを備えたシリアルトランシーバーを搭載し

をサポートします。たとえば、28nm 以下

ています。FPGA は少し前からこの性能に

の FPGA プロセッシングノードは、通常は

達しており、現在ではコンバーターがこれと

ファブリケーションテクノロジの最先端に位

同じ SerDes 性能に追いついています。こ

置付けられます。コンバータートランジス

れにより、単一の FPGA デバイス内で ( 多

タノードは、カスタムアナログデザインが

くの場合は複数の内部チャネルを使用して )

必要になるため、しばしば最先端の FPGA

複数のコンバーターの同期化処理が可能とな

に数世代遅れをとります。JESD204B と

ります。

は反対に、LVDS は通常は DC カップリン

使用したデザインでは、

I/O の要因を考慮に入れる必要があります。

グ方式を使用するため、コンバーターから低

アプリケーションに適したコンバーターの選択

消費電力の電源を備えた FPGA へのイン

データコンバーター上の高速シリアル伝送

コモンモード電圧の不一致が大きくなるほ

には、さまざまなアプリケーションに応じて

ど、静止電流は大きくなりますが、これはデー

さまざまな選択肢があります。データコン

タレートとは無関係です。これらの理由で、

ターフェイスをとることはより難しくなります。

バーターメーカーは、10 年以上にわたり、 JESD204B は、高分解能で高速なデータ主な差動信号方式テクノロジとして LVDS を

コンバーターのメーカーにとって非常に魅力

採用してきました。一部の LVDS アプリケー

的な差動信号処理テクノロジになっています。

http://japan.xilinx.com/

TOOLS OF XCELLENCE

図 1 – 12.5Gbps の JESD204B アイダイアグラムと LV-OIF-11G-SR 伝送マスク

JESD204B は、電気的仕様以外に、3 種

テゴリを定義する上限レートは、次に示すよ

め、信号品質に関するシステム設計者の懸

類の物理層についてアイダイアグラム性能に

うに、3.125Gbps、6.375Gbps、および

念が軽減されることです。DC カップリン

関する要件を規定しています。この性能の測

12.5Gbps です。

グ方式では、データラインに混入するコモ

定基準には、マスクに対する定義済みデータアイと合計ジッターバジェットが含まれま

●

312.5Mbps から 3.125Gbps まで

す。OIF (Optical Internetworking Forum) が策定した物理層 (PHY) の仕様とアイマス

●

クの基準は優れたものですが、JESD204B インターフェイスはこれを同じシリアルデータレートに利用します。JESD204B リンクは、OIF の低電圧 11 ギガビット短距離伝

LV-OIF-SxI5 ベースの動作 :

●

ンモードノイズの影響を受けやすくなります。 AC カップリング方式の 3 つ目の利点は、複数のベンダーから提供される各種のトランス

LV-OIF-6G-SR ベースの動作 :

ミッターの終端電圧の要件 (Vtt ) およびレ

312.5Mbps から 6.375Gbps まで

シーバーの終端電圧の要件が軽減され、レ

LV-OIF-11G-SR ベースの動作 :

シーバーが最適なコモンモード電圧で動作で

312.5Mbps から 12.5Gbps まで

きることです。これにより、さまざまな電源電圧に柔軟に対応しているシステムデザイン

送 (LV-OIF-11G-SR) 仕様で許容される合

各カテゴリは、広範囲にわたるデータレー

において、JESD204B トランスミッターお

計ジッター最大値 ( すなわち、ユニットイ

トがサポートされているので、それらの相違

よびレシーバーはさまざまな終端電圧で動作

ンターバル (UI) の 30%) を使用します。図

を調整するために、電気的仕様の最小値と

できます。

1 に 12.5Gbps での元の JESD204B ア

最大値が多少異なります。図 2 に、LV-OIF-

また、JESD204B インターフェイス

イダイアグラムとアイマスクを示します。こ

11G-SR 物理層の電気的仕様のパラメー

は、1 つのリンク上でデータを複数のコン

のアイマスクは、垂直軸と水平軸の両方

ターを示します。この層は JESD204B の

バーター用に分割できます。リンクレートが

で利用可能な確定的な量のマージンを許容

最大データレートである 12.5Gbps で使用

12.5Gbps に上がると、同一リンク上に共存

します。この 12.5Gbps のアイマスクは、されます。

できるコンバーターの数が増えます ( ほかの

11.1Gbps の速度に基づいた LV-OIF-11G-

複数の仕様がある AC カップリング方式

変数がすべて一定の場合でも。図 3 を参照 )。

SR 仕様を満たしていますが、12.5Gbps で

の利点の 1 つは、DC カップリング方式に

2 個、4 個、8 個、および 16 個のコンバー

は、11.1Gbps よりももっと厳しいタイミン

比べて、リンク上ではるかに広い範囲のコモ

ターを 1 つのパッケージに搭載したデバイス

グ要件が課されると考えられます。

ンモード電圧をサポートできることです。必

では、この機能は特に便利であり、LVDS イ

要に応じてレベルをシフトできるため、( 複

ンターフェイスに対する大きなメリットになり

3 種類の PHY

数のベンダーから提供される ) JESD204B

ます。LVDS は、I/O 構造として 1 個のコ

JESD204B はシリアルデータ伝送用

トランスミッターおよびレシーバーのシステ

ンバーターに対するダイレクト I/O をサポー

の 3 種類の物理層をサポートします。これ

ムデザイン要件が軽減されます。AC カッ

トしますが、I/O 上で複数のコンバーターか

らの物理層は LV-OIF 仕様によって定義さ

プリング方式のデータレーンの 2 つ目の

らのデータを結合する手法は明示的に定義

れ、JESD204B の最大レーンレートに

利点は、コモンモードノイズがトランス

していません。JESD204B には、複数の

よって分類されます。3 種類の物理層の各カ

ミッターとレシーバーの間で分離されるた

コンバーターからのデータを結合してシリア

46 Xcell Journal 86 号

TOOLS OF XCELLENCE

図 2 – LV-OIF-11G-SR JESD204B、12.5Gbps トランスミッターの電気的仕様は、リンク上のコモンモード電圧終端の柔軟性を示しています。

図 3 – さまざまなサンプルレートおよびチャネル数を使用するコンバーターの比較は、 I/O 数の大きな差を示しています。12.5Gbps で動作する JESD204B インターフェイスが使用するピンの数は、1Gbps で動作する LVDS インターフェイスの 10 分の 1 です。ル送信し、同じピン上で伝送するための明確

想コンバーターを利用して、JESD204B リ

JESD204B インターフェイスは、これらの

な仕様が存在します。しかも、それぞれの

ンク上で複数のコンバーター用のデータを送

課題のいくつかを解決するのに役立ちます。

デバイスデータのソースは、実際の固定的

信できます。

それに対して、LVDS DDR レーンは高いサ

なハードウェアコンバーターである必要はあ

ンプルレートでの帯域幅と性能に追いついて

りません。単一のハードウェアコンバーター

システムに最適なコンバーターの選択

いないため、LVDS インターフェイスでこれ

からの複数のデジタル処理出力の 1 つとし

コンバーターの高速化に向けた飽くなき

らの課題に対処しようとすると、レーンの数

て、出力データが実数パスと複素数パスの

帯域幅への要求は、省電力化と性能向上の

を増やさなければなりません。コンバーター

2 つに分割される、「仮想コンバーター」フィ

ために、より高度な CMOS プロセスノー

のデジタルインターフェイスのピン I/O、カッ

ルターからのデータであってもかまいません。ドへの移行をデザインに促しています。この

プリング、および電源ドメインの要件が、シ

90 度位相サンプリングに実数データと虚数

トレンドは、新しいインターフェイスへの課

ステムに最適なコンバーター選びの判断基準

データ (I&Q) を使用する通信システムも、仮

題をもたらします。最高速度 12.5Gbps の

になることを覚えておきましょう。

http://japan.xilinx.com/ 47

TOOLS OF XCELLENCE

How to Bring an SMC-Generated Peripheral with AXI4-Lite Interface into the Xilinx Environment

SMC で生成したペリフェラルと AXI4-Lite インターフェイスを

ザイリンクス環境に統合する方法 Sheetal Jain Senior R&D Engineer Synopsys skj@synopsys.com

48 Xcell Journal 86 号

TOOLS OF XCELLENCE

SMC ホストインターフェイス

Synphony Model Compiler (SMC) は、Simulink® および MATLAB® で作成されたデザインを合成し

ブロックを使用すれば、

て ASIC および FPGA ターゲット用に最適化された

Synphony Model Compiler で

ルです。SMC には、Simulink 環境で数値演算用、信

作成したデザインをザイリンクス

包括的な高位レベルのモデルライブラリが含まれてい

エンベデッドプラットフォームに

スデザイン環境内で、シングルレートまたはマルチレー

簡単に統合できます。

RTL を生成する、Synopsys 社のモデルベースツー号処理用、および通信用のデザインを作成するためのます。このライブラリにより、高位レベルのモデルベートの固定小数点演算 / 浮動小数点演算アルゴリズムをキャプチャして、その機能のデバッグを簡単に行えます。SMC RTL 生成エンジンは、これらの検証済みモデルを使用して RTL を自動的に生成します。生成した RTL は、ハードウェアインプリメンテーションや、複数のアーキテクチャの実装面積、性能、消費電力、およびスループットのトレードオフの迅速な検討に使用できます。SMC の高位合成エンジンは、トップレベルのデザインと MATLAB 言語入力を取り込み、選択したハードウェアターゲット用に最適化された RTL を生成します。また、SMC はデザイン用の RTL テストベンチとともにビット / サイクルに正確な C モデルおよび SystemC ラッパーを自動的に生成し、SystemC シミュレーション環境内での生成されたハードウェアの検証を可能にします。多くのアプリケーションでは、設計者は何らかの信号処理機能を実行するためのペリフェラルを作成し、ザイリンクス MicroBlaze ™ ソフトプロセッサコアなどのホストプロセッサを介してこのペリフェラルを構成する必要があります。ホストプロセッサは、通常は AMBA® AXI4 または AXI4-Lite などの標準的なバスインターフェイスを使用してペリフェラルに接続します。SMC ライブラリには、ホストプロセッサにスレーブインターフェイスをインプリメントするホストインターフェイスブロックが含まれています。このホストインターフェイスブロックは、AXI4-Lite、APB、 Generic Interface、および Avalon-MM バスインターフェイスプロトコル標準をサポートします。またホストインターフェイスブロックは、FIR フィルター係数、数値制御オシレーター (NCO) の周波数と位相の設定、可変長 FFT ブロックの FFT 長など、SMC デザインを構成するのに必要なメモリマップレジスタをインプリメントします。ホストインターフェイスブロックは、これらのメモリマップドレジスタを、非同期を含む任意の希望のサンプルレートでバスインターフェイスクロックにインプリメントできます。バスインターフェイスとメモリマップの設定値は、ホストインターフェイスブロックの UI 内で指定できます。設計者は、ホストインターフェイスブロックを使用して、SMC デザインをバスインターコネクトまたはバスマスターに接続できます。

http://japan.xilinx.com/

TOOLS OF XCELLENCE

図 1 – SMC バスインターフェイスプロトコルの仕様

本稿では、SMC ホストインターフェイスブロックで設計したペリフェラルをザイリ

インターフェイスブロックを使用してバスインターフェイスプロトコルとメモリマップを

ンクスエンベデッド開発キット (EDK) プロ

最初に、SMC ライブラリブロックを使用

構成する方法を示します。

ジェクトにインポートし、統合する方法につ

してペリフェラルのアルゴリズムのインプリメ

統合を容易にするために、必須ではあり

いて詳しく説明します。また、標準的なバス

ンテーションを作成し、その機能を検証しま

ませんが、ザイリンクス EDK が要求する命

インターコネクトを介してペリフェラルに接

す。次に、( メモリマップのパラメーターを

名規則に従って SMC モデル内のバスイン

続される MicroBlaze ホストプロセッサか

定義する ) アルゴリズム部分のコンフィギュ

ターフェイスポートの名前を付けることを強

らの AXI4-Lite トランザクションをシミュ

レーションデータと ( バスインターフェイス

く推奨します。標準的な AXI4-Lite インター

レートする方法についても検討します。この

のパラメーターを定義する ) システムのイン

フェイスの信号名に「S_AXI_」を追加しま

プロセスには、次の 4 つの主な手順があり

ターコネクトバスプロトコルの 2 つの要因

す。たとえば、AXI アドレス書き込みチャネ

ます。

に基づいて、SMC ホストインターフェイス

ル (AWADDR) のアドレス信号は S_AXI_

ブロックを構成します。次に、ホストインター

AWADDR という名前にします。AXI4-Lite

フェイスブロックをペリフェラルのアルゴリ

の命名規則に従わない信号については、ペリ

ズム部分に接続します。ホストインターフェ

フェラルをザイリンクス EDK にインポートす

イスブロックの一部のパラメーター ( たとえ

るとき、ポート名を AXI4-Lite の信号名に対

ば、バスインターコネクト、アドレス幅、ベー

応付ける機会がもう一度あります。また、ザ

スアドレスなど ) は、ターゲットとするプラッ

イリンクス EDK は名前に大文字を含むペリ

1. IP コアおよびホストインターフェイスブロックと ( デザイン用の最適化された RTL インプリメンテーションを生成するための ) SMC RTL 生成エンジンを使用して、Simulink 内でペリフェラルを作成します。 2. 作成したペリフェラルをザイリンクス EDK プロジェクトにインポートし、デザインのそれ以外の部分と統合します。 3. SDK 内でソフトウェアアプリケーションを開発します。 4. RTL を生成してシミュレーションを行い、ハードウェアとソフトウェアの機能の正しさをチェックします。

手順 1 : SMC ライブラリを使用してペリフェラルを作成する

50 Xcell Journal 86 号

トフォームによって決まります。この例では、フェラルをサポートしないため、Simulink モプラットフォームにザイリンクス Virtex® -7

デル名には大文字を使用しないでください。

FPGA を選び、バスインターフェイスに

ホストインターフェイスブロックの追加、

AXI4-Lite を選びました。このプラットフォー

構成、接続が完了したら、SMC の RTL 生

ムでは、各ペリフェラルのアドレス幅、ベース

成エンジンを使用してペリフェラルの RTL

アドレス、およびアドレス空間に若干の制限

を生成します。RTL 生成エンジンがター

が課されます。アドレス幅は 32 ビット、ベー

ゲットデバイスに最適化されたハードウェ

スアドレスは 4K バイトの倍数でなければ

アを生成するように、SMC の UI 内でター

ならず、利用可能な最小アドレス空間は 4 K

ゲットデバイス、インプリメンテーションパ

バイトになります。図 1 と図 2 に、ホスト

ラメーター、および最適化制約を指定しま

TOOLS OF XCELLENCE

す。SMC が生成したトップ RTL 内で、「C_ BASEADDR」と「C_HIGHADDR」の 2 つ

手順 2 : ペリフェラルをザイリンクス EDK にインポートし、統合する

ウィザードの次のページで、EDK がバスインターフェイスを接続できるように、ペリ

の仮想パラメーター ( トップ RTL が VHDL

次の手順では、ペリフェラルハードウェア

フェラルの AXI4-Lite ポートを選択し、標

の場合はジェネリック ) を追加します。ご使

を EDK の Xilinx Platform Studio (XPS)

準的な AXI4-Lite ポートにマッピングしま

用の IP コアの仕様に合わせて、これらのパラ

にインポートし、システム内で必要な接続

す。SMC モデル内で定義されたバスイン

メーターのデフォルト値を、メモリマップド

( バスインターフェイスポートおよびファン

ターフェイスポートの名前が標準的なバス

空間のベースアドレスとメモリマップド空間

クションポート ) を行います。この例では、ポート名と一致する場合は、EDK はそれら

の最上位アドレスに割り当てます。EDK がペ

Micro-Blaze プロセッサ、実行ソフトウェア

のポートを自動的にマッピングします ( 図 4

リフェラルのメモリマップドアドレス空間を

格納用のブロック RAM (BRAM)、ローカ

を参照 )。

識別するには、この手順が必要です。SMC

ルメモリバス (LMB)、AXI4-Lite インター

たとえば AXI4-Lite クロック (Clk-Div3)

で生成したデザインのトップレベル Verilog

コネクト、および Micro-Blaze デバッグモ

信号やリセット (GlobalReset) 信号で解る

RTL の例を次に示します。追加する必要のあ

ジュールで構成される基本システムを作成し

ように、ポート名が一致しない場合は、自動

る 2 つのパラメーターがハイライト表示され

ました。

マッピングを無効にして上書きできます。

ています。

XPS GUI の [Hardware] カテゴリで [Cre-

次に、レジスタ空間のベースアドレスと最

ate or Import Peripheral] オプションを選

上位アドレスを、手順 1 で RTL に挿入され

択します。Create and Import Peripheral

た C_BASEADDR および C_HIGHADDR

ウィザードが開きます。このウィザードで

パラメーターとしてそれぞれ指定します。ホ

(__list_of_ports_will_be_available_

[Import existing peripheral] オプション

ストインターフェイスブロックはアドレス指

here__

を選択します。次に、ペリフェラルを格納す

定可能なコンフィギュレーションレジスタ空

るパス、デザイン名、およびファイルタイプ

間を持っているため、メモリ空間オプション

(HDL) を指定します。ここで、SMC で生成

をオフにします。しかし、次のページの RTL

module host_inferface_for_edk_top

); parameter C_BASEADDR = 32’h41418000; parameter C_HIGHADDR = 32’h41418fff;

されたすべての RTL ファイルを追加します。パラメーターのデフォルト属性は変更せずに RTL のコンパイルが正常に終了したら、ペリ

そのまま残し、ホストインターフェイスブ

フェラルがサポートするバスインターフェイ

ロック内で指定したパラメーターと確実に一

ス ( すなわち、図 3 に示すように、AXI4-

致するようにします。

Lite スレーブインターフェイス ) を指定する

次のスクリーン画面は [Port Attributes]

必要があります。

というタイトルです。ここでは、デザイン内

図 2 – SMC ホストインターフェイスブロックのメモリマップパラメーターの設定

http://japan.xilinx.com/

TOOLS OF XCELLENCE

図 3 – ペリフェラルがサポートするバスインターフェイスの指定 (ここでは AXI4-Lite)

図 4 – 該当する AXI4-Lite バスインターフェイス信号への RTL ポートのマッピング

52 Xcell Journal 86 号

TOOLS OF XCELLENCE

図 5 – クロックポートおよびリセットポート用に指定された信号タイプを含む *.mpd ファイル

図 6 – AXI4-Lite バスと MicroBlaze プロセッサに接続された、SMC で生成したデザインの追加のクロックまたはリセットに対するそ

ロセッサペリフェラル記述 (*.mpd) ファイル

れらのクロックまたはリセットの属性を指定

と、ペリフェラルのパラメーターおよびポー

する必要があります。次のスクリーン画面で

トに関する情報が含まれます。クロック / リ

[Finish] をクリックして、XPS プロジェクト

セットポート上で SIGIS = CLK パラメー

にペリフェラルを追加します。これで SMC

ターと SIGIS = RST パラメーターが定義さ

ペリフェラルは XPS に正しくインポートさ

れていることを確認します。これらのパラメー

れました。このことは <project_working_

ターが定義されていない場合は、*.mpd ファ

directory>/pcores フォルダーをチェックすることで確認できます (XPS はここにペリ

ます。[XPS Core Config] ウィンドウが開きます。このウィンドウのパラメーターは編集しないでください。ザイリンクス EDK フローに従って、デフォルトの設定値を変更せずにそのまま残します。指定されたアドレス空間を EDK が受け入れない場合は、指定し

たメモリマップ内でデザイン内のほかの何イルを編集して手作業で定義を追加します。らかのペリフェラルと競合していることを示図 5 に、これらのパラメーターが追加されします。この場合は、SMC に戻り、新しい

フェラルの名前のディレクトリを作成する )。た *.mpd ファイルの例を示します。このディレクトリに移動して、RTL ファイルが

これで、XPS GUI の [IP Catalog] セク

正しくインポートされたことを確認します。

ションの [Project Local PCores] の下の

XPS は、HDL ディレクトリと並行して

[USER] サブカテゴリに、インポートされた

data という名前のディレクトリを作成しま

ペリフェラルが表示されます。ペリフェラル

す。この data ディレクトリには、マイクロプ

名を右クリックし、[ADD IP] をクリックし

ベースアドレス値を指定して RTL を再生成してから、上記の手順を繰り返して SMC ペリフェラルをインポートする必要があります。正しいベースアドレス値と最上位アドレス値が利用可能になったら、[Core Config] ウィンドウで [OK] をクリックします。

http://japan.xilinx.com/

TOOLS OF XCELLENCE

ここで、XPS GUI の [Project] カテゴリで [Export hardware design to SDK] オプションを選択し、ザイリンクスソフトウェア開発キットにハードウェアをエクスポートします。RTL シミュレーションのみを実行する場合は、ビットストリームを生成する必要はありません。エクスポートの完了後、XPS は、SDK に対してハードウェアを記述する *.xml ファイルを作成します。このファイルは、通常は <project_ working_directory>/ SDK/SDK_Export/hw フォルダーに作成されます。図 7 – *.mhs ファイルに挿入された、クロックポートおよびリセットポートの接続

手順 3 : ザイリンクス SDK を使用してソフトウェアドライバーを開発する

統合プロセスの次の手順では、ザイリンクス SDK を使用してソフトウェアドライバーを開発します。SDK を起動し、*.xml のソースとなるハードウェアプラットフォーム仕様プロジェクトを作成します。EDK 内で [Export and Launch] オプションが選択されている場合、プロジェクトは自動的に作成され、XPS 内の IP ブロックとアドレスマップ情報が SDK プロジェクト内で利用可能になります。ボードサポートパッケージ (BSP) を作成する前に、ペリフェラル用のドライバーファイルを作成する必要があります。標準的なドライバーヘッダーファイルは、メモリマップドレジスタのオフセットアドレスと、これらのレジスタの読み出し / 書き込み用のプロトタイプを定義しなければなりません。 SDK プロジェクトリポジトリにドライバーファイルをコピーしてドライバーを指定し、次に BSP プロジェクトを作成します。図 8 – テストベンチテンプレートおよびビヘイビアーシミュレーションモデルを生成するプロジェクトのセットアップ

新しい空のアプリケーションプロジェクトを開き、ペリフェラルとの間でデータの読み出し / 書き込みを行うためのソフトウェアを作

XPS は [Instantiate and Connect IP]

的に接続されていない場合は、<project_

成します。このプロジェクト内で、この手順

GUI を開きます。利用可能なプロセッサに

working _director y> 内のマイクロプロ

の最初の作業で作成したハードウェアター

よって駆動されるインターコネクトバスにペ

セッサハードウェア仕様ファイル <project_

ゲットプラットフォームと、作成したばかり

リフェラルを自動的にリンクするように XPS

name>.mhs を編集します。図 7 に、クロッ

の BSP を指定します。[BSP Settings]

ツールに指示することも、手作業でペリフェ

クポートおよびリセットポートが追加され

ウィンドウに、デザイン用のペリフェラルド

ラルを接続することもできます。接続が完了

た *.mhs ファイルを示します。

ライバーコアが表示されます。

すると、図 6 に示すインターフェイス接続が

次に、[System Assembly View] ウィン

アプリケーションプロジェクトには、アプ

表示されます。

ドウの [Ports] タブを使用して、デザインの

リケーションのソフトウェアコードが書き込

AXI4-Lite に関連するクロックおよびリ

非 AXI4-Lite ポートを接続します。[System

まれる main.cc ファイルが含まれます。こ

セットが [Graphical Design View] タブ

Assembly View] の [Addresses] タブで、ペ

のファイルが作成されると、SDK は自動的

のバスインターフェイス接続内で接続さ

リフェラルのアドレス空間が表示され、アドレ

にこのコードをコンパイルし、RTL シミュ

れていることを確認します。これらが自動

ス範囲がロックされていることを確認します。

レーション環境内でソフトウェアコードの

54 Xcell Journal 86 号

TOOLS OF XCELLENCE

シミュレーションに使用される *.elf ファイル

[Choose Simulation Elf file] をクリックし

を作成します。

て、SDK が作成した Elf ファイルのパスを

アプリケーションプロジェクトには、アプ

指定します。このファイルはアプリケーショ

リケーションのソフトウェアコードが書き込

ンプロジェクトフォルダーにあります。テ

まれる main.cc ファイルが含まれます。簡

ストベンチテンプレートとビヘイビアーシ

用して、SMC で生成したペリフェラルを、

単な例として、メモリマップの最初の 2 つ

ミュレーションモデル ( 図 8 を参照 ) を作

AXI4-Lite スレーブインターフェイスを使

のレジスタ (Status_register と Control_

成するには、GUI の [Project] カテゴリで

用するザイリンクスエンベデッドプラット

[Project Options] の [Design Flow] タブ

フォームに統合するのは簡単です。SMC と

れます。このファイルが作成されると、SDF

の設定値を選択します。

ザイリンクスエンベデッドプラットフォー

は自動的にコードをコンパイルし、RTL シ

次に、[Generate HDL Files] をクリック

ムの組み合わせは、ホストプロセッサと統

ミュレーション環境内でソフトウェアコード

して HDL ファイルを作成し、ISE (ISim)

合される DSP ペリフェラルの設計と開発

のシミュレーションに使用される *.elf ファイ

HDL シミュレータを起動して機能の正しさ

に役立つ強力なツールセットを提供します。

ルを作成します。手順 4 に示すように、この

をチェックします。図 9 に、SDK プロジェク

SMC 内のホストインターフェイスブロック

*.elf ファイルを使用して機能を検証できます。

ト内のソフトウェア C コードで MicroBlaze

は、統合をシームレスに完了し、エンベデッ

プロセッサが開始した AXI4-Lite トラン

ドプラットフォーム用の強力なソリューショ

手順 4 : XPS 内で RTL ファイルを生成する

ザクションを示します。ペリフェラルの最初

ンを作成するのに必要なインターフェイスを

の 2 つのレジスタ (Status_ register と

提供します。

最後の手順では、XPS 内で RTL を生

Control_register) の値が予想どおりに変

SMC の詳細は、http://www.synopsys.

成し、シミュレーションを行ってハードウェ

化していることに注意してください。ペリ

c o m / S ystems / Blo ck D esig n / H L S /

アとソフトウェアの機能の正しさを検証し

フェラルのインターフェイス上の対応する

P a ges / S y nph o ny - M o del - C o mpile r.

ます。XPS GUI 内で、[Project] カテゴリ

AXI4-Lite 信号は、SMC で作成したペリ

aspx?cmp=fpga-xcell-85-smc をご覧

の [Select Elf file] オプションを選択し、フェラルがエンベデッドプロジェクトに正

しく統合されたことを示しています。

強力なツールセット

ホストインターフェイスブロックを使

ください。

図 9 – MicroBlaze プロセッサによって開始された AXI4-Lite トランザクション

http://japan.xilinx.com/

Xilinx Introduces Vivado Design Suite 向け UltraFast ™ 設計手法 ®

ザイリンクス

UltraFast 設計手法は迅速で予測可能な

設計サイクルを可能にします。

詳細はこちら

: japan.xilinx.com/ultrafast