Posts Tagged with "BSV"

既に発行済みのブログであっても適宜修正・追加することがあります。
We may make changes and additions to blogs already published.
posted by sakurai on December 18, 2023 #718

他にはどうでしょうか?キャッシュコントローラは?

ChatGPT
キャッシュコントローラの設計においても、C/C++によるハードウェア合成が直面する可能性のある困難な点をいくつか挙げることができます。キャッシュコントローラは、メモリアクセスの最適化、データの同期、コヒーレンシ管理など、高度な制御と精密なタイミングが求められる複雑なハードウェアコンポーネントです。

C/C++によるキャッシュコントローラの設計の困難点

  1. 並行処理と同期:
    キャッシュコントローラは、メモリアクセス要求を並行して処理し、コア間でのデータのコヒーレンシを維持する必要があります。C/C++では、これらの並行処理と精密な同期を表現するのが難しいです。

  2. 状態管理の複雑さ:
    キャッシュコントローラは複数の状態を持ち、これらの状態に基づいて動作します。C/C++での状態管理は、ハードウェアの論理に直接対応するのが難しく、合成ツールでの解釈に依存します。

  3. 最適化の限界:
    ハードウェアの効率とパフォーマンスを最大化するための最適化は、C/C++では自動的には行われにくく、手動での微調整が必要になることがあります。

  4. 合成ツールの制約:
    C/C++コードからハードウェアへの変換を行う合成ツールは、キャッシュコントローラのような複雑なハードウェアの動作や最適化を完全に把握するのが困難です。

BSVなどのハードウェア記述言語によるアプローチ

BSVのようなハードウェア記述言語では、キャッシュコントローラの設計に関連するこれらの問題をより効果的に解決できます。BSVは、ハードウェアの並行性、状態管理、同期メカニズムを表現するための直接的な機能を提供し、キャッシュコヒーレンシの複雑なロジックをより簡単にモデル化できます。

結論

キャッシュコントローラの設計に関しては、C/C++によるハードウェア合成よりも、BSVなどの専用のハードウェア記述言語を使用する方が適しています。これにより、並行処理、同期、状態管理などの複雑な要素をより効率的かつ正確に扱うことができます。また、特にキャッシュコヒーレンシなどの高度な概念を扱う際には、これらの言語の提供する高レベルの抽象化が大きな利点となります。


左矢前のブログ 次のブログ右矢

posted by sakurai on December 15, 2023 #717

C/C++の欠点がどのくらいのインパクトなのかを聞いてみました。

上記のC/C++の欠点は同じような点を述べていますが、具体的に困難な例を挙げてください。例えばパイプラインプロセッサは設計できますか?

ChatGPT
C/C++によるハードウェア合成で特に困難となる例を挙げると、高度なパイプラインプロセッサの設計などがあります。C/C++による合成で直面する具体的な問題点を以下に詳述します。

C/C++によるハードウェア合成の困難な例:パイプラインプロセッサ

  1. 並行処理の表現:
    C/C++は基本的に逐次実行を前提とした言語であり、ハードウェアのような同時多発的な並行処理を直接的に表現するのが困難です。パイプラインプロセッサは複数のステージが並行して動作するため、この並行性をC/C++で自然にモデル化するのは難しいです。

  2. タイミングと同期の管理:
    パイプラインプロセッサでは、各ステージ間の正確なタイミングとデータの同期が重要ですが、C/C++ではこれらの低レベルのタイミング制御や同期メカニズムを直接扱うことが困難です。

  3. リソース共有と競合:
    C/C++による合成では、共有リソース(メモリ、レジスタなど)へのアクセス制御や競合の解決が直感的ではありません。パイプラインプロセッサの設計では、これらの要素の管理が重要です。

  4. 最適化の自動化の限界:
    C/C++のコードからハードウェア記述への変換では、特にパイプラインプロセッサのような複雑な構造に対する最適化が自動的には行われにくいです。これは、合成ツールがC/C++コードの意図を完全に解釈し、最適なハードウェア構造に変換するのが難しいためです。

対照的にBSVでのアプローチ

BSV(Bluespec SystemVerilog)のようなハードウェア記述言語を使用する場合、これらの問題はより効率的に扱えます。BSVはハードウェアの並行性、タイミング制御、同期メカニズムを直接的に表現するための機能を提供し、パイプラインプロセッサのような複雑なハードウェア構造の設計に適しています。

結論

パイプラインプロセッサの設計においては、C/C++による合成よりも、BSVのようなハードウェア記述言語を使用する方が、その特性とニーズに適していると言えます。ハードウェアの並行性、タイミング、同期の問題をより直接的かつ効率的に扱うことが可能です。


左矢前のブログ 次のブログ右矢

posted by sakurai on December 14, 2023 #716

ChatGPTにC/C++とBSVのいずれが良いかを聞いてみました。

ハードウエアエンジニアは通常verilogを学習しますが、それは必須の知識として、次に習得するのはC/C++による合成、BSVによる合成のどちらが良いでしょうか?

ChatGPT
ハードウェアエンジニアリングにおける知識とスキルセットは、そのエンジニアの具体的な役割や業務内容、キャリアの目標に大きく依存します。Verilogを習得した後に取り組むべき次のステップは、個々の目標やプロジェクトのニーズに基づいて決定されるべきです。C/C++による合成とBluespec SystemVerilog(BSV)による合成は、それぞれ異なる利点を持ち、異なる用途に適しています。

(中略)

それぞれの欠点を調べてその欠点が致命的であれば、反対の手法を選択するやりかたもあると思いますが、それぞれの欠点は?ソフトウェアプログラミングではなくハードウェアエンジニアリングの観点から教えてください。

(中略)

ChatGPT
ハードウェアエンジニアリングとハードウェア合成の観点から、C/C++による合成とBSV(Bluespec SystemVerilog)による合成の欠点を再考します。

C/C++による合成の欠点(ハードウェアエンジニアリングの観点)

  1. 抽象化のレベル:
    C/C++では、ハードウェアの低レベルの動作や特性を直接表現するための抽象化が限られています。これにより、複雑なハードウェアロジックの表現が困難になることがあります。

  2. ハードウェア特有の最適化の欠如:
    C/C++は、元々ソフトウェア開発用に設計された言語であるため、ハードウェア設計に特有の最適化や機能が不足している場合があります。

  3. 合成ツールの限界:
    C/C++からハードウェア記述に変換する合成ツールは完全ではなく、特定のハードウェア設計パターンや最適化を自動的に認識できない場合があります。

BSVによる合成の欠点(ハードウェアエンジニアリングの観点)

  1. 普及度とサポート:
    BSVは比較的ニッチな技術であり、広範囲にわたるコミュニティサポートやリソースが限られている可能性があります。

  2. 学習曲線:
    BSVは比較的新しい言語であり、一般的なハードウェア記述言語(HDL)とは異なるパラダイムを採用しています。そのため、新しい概念やアプローチを学ぶ必要があります。

  3. ツールとエコシステムの制限:
    BSVをサポートするツールやエコシステムは、より広く普及している言語に比べると限定的である可能性があります。

決定を下すための考慮事項

  1. プロジェクトの要件:
    ハードウェア設計の複雑さや特定の性能要件に基づいて適切な技術を選択します。

  2. 将来の適用範囲:
    長期的な視点で、どの技術が将来のプロジェクトに適しているかを考慮します。

  3. 既存の知識とリソース:
    チームの既存の知識と利用可能なリソースを考慮し、新しい技術の学習にかかる時間と労力を評価します。

ハードウェアエンジニアリングにおいては、技術選択はプロジェクトの特定の要件とチームの状況に依存します。欠点がプロジェクトの目標やチームの能力に影響を与える場合、別のアプローチを検討するのが適切です。


左矢前のブログ 次のブログ右矢

posted by sakurai on December 13, 2023 #715

Hardware Description Language Advent Calendar 2023 の第11目として、「BSV (Bluespec System Verilog) によるPongの設計」と題する記事をQiitaに投稿しました。

図%%.1
図715.1 Qiita投稿

以下に目次を示します。

  • Pong Game
  • 強化学習の題材としてのPong
  • BSV
  • BSVをより深く知るためには
  • Cmod A7
  • CmodA7toPMODボードの設計
  • パドルコントロール
  • CmodA7toPMODボード回路
  • FPGA内部ブロック図
  • グラフィックサブシステム
  • ゲームサブシステム
  • ボール方向制御
  • ボール動作
  • ボール制御BSVコード
  • サウンドサブシステム
  • サウンドステートマシン
  • ADC
  • 設計計算例
  • 完成画面
  • 今後の予定や感想

左矢前のブログ 次のブログ右矢

Pongの開発 (16)

posted by sakurai on December 12, 2023 #714

CmodA7toPMODV6の実装

JLCPCBからV6基板が届いたので、早速実装して動作試験をしてみました。あいかわらず、スイッチを押すとブーという音が出ます。いろいろと試したところXADCのクロックが100MHz推奨であるものを1/10以下に落としたら、画面もきれいになりスイッチのブー音も消えました。ただし、依然として画面の斜め縞は出ており原因不明です。インベーダーゲームでは出現しないので、XADCを起動させると出ることは確かです。

一方、初めて基板厚を0.8mmと従来の半分にしてみましたが、DCジャックの足も折れ曲がり代が増え、こちらは良好です。

図%%.1
図714.1 CmodA7toPMODV6ボード基板

JLCPCB費用他

表714.1 JLCPCB費用まとめ
内容 費用[USD]
基板製造費(5枚) 2.00
部品代(15個) 5.48
基板実装費(5枚) 12.79
配送費(OCS) 9.0
クーポン ▲9.0
合計 20.27

時間としては基板製造と部品実装で2日間、最安のOCS配送が7日間で、計9日間で到着しました。


左矢前のブログ 次のブログ右矢

Pongの開発 (15)

posted by sakurai on December 11, 2023 #713

CmodA7toPMODの改版

CmodA7toPMODV5の実機評価の結果、数点ノイズが原因らしい問題点が発覚しました。原因は恐らくCmodA7ボードからコネクタを2回とおして遠くのスイッチまで伝送線路が伸びていることによるノイズと思われます。そのためUltra96toPMODボードと同様にバッファICを入れる改版を行います。以下に回路図を示します。

図%%.1
図713.1CmodA7toPMODV6ボード回路図

Ultra96toPMODで使用したときは1.8V信号と3.3V信号のレベル変換の必要上からTXS0108Eを使用しました。今回は3.3Vどうしでレベル変換は不要ですが、同ICをバッファとして使用しました。

ついでにアナログ入力が2chあるので、パドルを2個接続できるようにピンソケットを増設しました。以下に同ボードのBOM及びP&P表を示します。

図%%.2
図713.2 BOM表

図%%.3
図713.3 P&P表

PCBAはいつものように格安のJLCPCBに依頼しました。約20 USDで実装及び部品代込みです。

図%%.4
図713.4 Gerber図

今回DCジャックの足を折り曲げる必要からPCB厚を最安の費用の範囲内で最薄の0.8mmに変更しました。代償として基板色はグリーンしか選べませんでした。

図%%.5
図713.5 PCB厚

左矢前のブログ 次のブログ右矢

Pongの開発 (14)

posted by sakurai on December 8, 2023 #712

QSPIプログラミング

FPGAプログラミングにはVivadoやPCやUSBケーブル等が必要ですが、電源を投入してアプリケーションをすぐに動作させるためにはCmodA7ボード上のQSPI Flashに書き込む必要があります。基本的には過去記事:Artyで実施したのと同じ手順ですが、異なる点だけを示します。

  • Binファイルの作成: 過去記事どおりに実施します。
  • Binファイルの焼きこみ: 選択するFlashの型格に注意します。以下の図のとおり、mx25I3273f-spi-x1_x2_x4を選択します。間違えて異なる型格を指定すると、Vivadoがエラーを出力し正しい型各を教えてくれます。

図%%.1
図712.1 Flash選択画面

左矢前のブログ 次のブログ右矢

Pongの開発 (13)

posted by sakurai on December 7, 2023 #711

パドル動作

完成したADCとパドルVRの連携を以下の動画に示します。パドルの描画アルゴリズムは

  • 新しいADCの値を取得
  • ADCの値を要素8の移動平均化(フラつき防止のため)
  • 閾値4と移動値(ADC値-現在値)を比較し、閾値を超えていたら移動(フラつき防止のため)
  • 移動値を座標制限内にクリッピング
  • 移動の際には現在のパドル像を消去(ゴミ残り防止のため)
  • 前回値と同じであれば書き換えをしない(チラつき防止のため)

図%%.1
図711.1 パドル動作

ボール動作

ボールがパドルと衝突する判定は、ボール座標のVRAMデータを読み出して行います。右パドルのVRAMデータは3であるため、移動のたびにボール座標を読み出し3であれば衝突と判断します。

パドルのy座標範囲は0~25であり、これを①0~5,②6~12、③13~19、④20~25の4領域に分割します。①に衝突した場合は-45°の角度で反射し、②は約-18.4°の角度で反射します。これをxとyの増分であるdx, dyに変換すれば、-45度の場合はdx=1, dy=-1であり、-18.4度の場合はdx=3, dy=-1です。

図%%.2
図711.2 ボール衝突動作

左矢前のブログ 次のブログ右矢

Pongの開発 (12)

posted by sakurai on December 6, 2023 #710

実験によるフィードバック

VRを実際にADCに接続してJTAG経由で測定したところ、VRと付属回路の電圧値は0.158~0.711Vとなりました。LTSpiceの値と異なったのは手持ちの適当な抵抗を付けたからかもしれません。

また、パラメータ化したa, bはデフォルト値のa=105, b=90で特に違和感はありませんでした。特に可変範囲は90°としました。これは全回転角が300°でリニアの場合ですが実際にはそうではなく、使用角度bは45°くらいとなりました。

ADCの出力をちょうどy座標の動作範囲にクリップしていましたが、実験の結果、パドルが端にくっつかない問題がありました。そのためADCの出力を、動作範囲よりも5%ほど大きめにして座標計算でもクリップすることにします。

さらにパドル消去アルゴリズムを変更したため、パドルの大きさも多少変えました。従って、再度設計計算を行います。一度方式としては確定しているため、数値を少々変更するだけです。変化点をマーカで表示します。ピンク前記事との変化点であり、ブルーは最終結果としてソースコードに入れる値です。

  • VRの全角度は300°
  • VRの有効角はパラメータ化し、開始角a[°] (デフォルト値a=105)、範囲b[°] (デフォルト値b=90)
  • VRの全角度の際のADC入力電圧は測定結果より、0.16~0.71[V]

図%%.1
図710.1 レベルダイア

再設計計算

これらより、ADC入力電圧は開始角$a$の値を$V_\text{a}$、終了角$a+b$の値を$V_\text{a+b}$として、 $\require{color} \definecolor{pink}{rgb}{1.0,0.8,1.0} \definecolor{blue}{rgb}{0.8,0.8,1.0}$

  • $V_\text{L}=\colorbox{pink}{0.16}$, $V_\text{H}=\colorbox{pink}{0.71}$
  • $V_\text{range}=V_\text{H}-V_\text{L}=\colorbox{pink}{0.55}$
  • $V_\text{a}=\frac{V_\text{range}}{300}a+V_\text{L}$
  • $V_\text{a+b}=\frac{V_\text{range}}{300}(a+b)+V_\text{L}$

次にAD変換後のデータDは入力全範囲0~1[V]を4096分割する。開始角の値を$D_\text{a}$、終了角の値を$D_\text{a+b}$として

  • $D_\text{a}=4096V_\text{a}=\frac{4096V_\text{range}}{300}a+4096V_\text{L}=\colorbox{pink}{7.509}a+\colorbox{pink}{655.4}$
  • $D_\text{a+b}=4096V_\text{a+b}=\colorbox{pink}{7.509}(a+b)+\colorbox{pink}{655.4}$
  • $D_\text{range}=D_\text{a+b}-D_\text{a}=\colorbox{pink}{7.509}b$

一方、y座標の制約は以下のとおりであり、$y_\text{top}$(上限$y_\text{max}$+5%)と$y_\text{bottom}$(下限$y_\text{min}$-5%)の値でクリッピング。

  • $y_\text{min}=\colorbox{pink}{44}, y_\text{max}=\colorbox{pink}{219}, Paddle_\text{h}=\colorbox{pink}{26}$
  • $y_\text{bottom}=y_\text{min}-7=\colorbox{pink}{37}, y_\text{top}=(y_\text{max}-Paddle_\text{h})+7=\colorbox{pink}{200}$
  • $y_\text{range}=y_\text{top}-y_\text{bottom}=200-37=\colorbox{pink}{163}$

これらからy座標を求めると、ADCのデータを$D$とすれば、

  • $y=\frac{y_\text{range}}{D_\text{range}}(D-D_\text{a})+y_\text{bottom}=\frac{\colorbox{pink}{163}}{\colorbox{pink}{7.509}b}D-\frac{\colorbox{pink}{163}}{b}a-\frac{\colorbox{pink}{163}\cdot\colorbox{pink}{655.4}}{\colorbox{pink}{7.509}b}+\colorbox{pink}{37}\\ =\frac{\colorbox{pink}{347.3}}{b\ll4}D-\frac{\colorbox{pink}{163}}{b}a-\frac{\colorbox{pink}{14225}}{b}+\colorbox{pink}{37}=\frac{\colorbox{blue}{347}D-\colorbox{blue}{2608}a-\colorbox{blue}{227607}}{b\ll4}+\colorbox{blue}{37}$

y式中のシフトは固定小数点演算を行うために分母分子を16倍しているものです。さらに最小値$D_\text{a}$、最大値$D_\text{a+b}$で入力ADCデータのクリッピングを行います。

  • $D_\text{a}=\colorbox{pink}{7.509}a+\colorbox{pink}{655.4}=(\colorbox{blue}{120}a+\colorbox{blue}{10486})\gg4$
  • $D_\text{a+b}=\colorbox{pink}{7.509}(a+b)+\colorbox{pink}{655.4}=(\colorbox{blue}{120}(a+b)+\colorbox{blue}{10486})\gg4$

以上より、完成したBSVコードの変更点のみを以下に示します。

クリッピング値計算部分

            // 座標の下限-5%と上限+5%に対応するADC値の計算
            Bit#(20) adcMinValue = (120 * extendedA + 10486) >>4;     // Min = 7.509A + 655.4
            Bit#(20) adcMaxValue = (120 * (extendedA + extendedB) + 10486) >> 4; // Max = 7.509(A+B) + 655.4

ADCからy値計算部分

            Bit#(24) coordinate = ((zeroExtend(clippedAdcValue) * 347
                   - zeroExtend(extendedA) * 2608 - 227607)
                                   / zeroExtend(extendedB) >> 4) + 37;

変換器部分はこのとおりですが、FSM中でのパドルの可動範囲$y_\text{min}=\colorbox{blue}{44}$、$y_\text{max}-Paddle_\text{h}=219-26=\colorbox{blue}{193}$でクリッピングすることを忘れないように注意します。


左矢前のブログ 次のブログ右矢

Pongの開発 (11)

posted by sakurai on December 5, 2023 #709

CmodA7からPMODへのインタフェース基板のため、CmodA7toPMODV5と名付けました。そのGerber図が図709.1であり、JLCPCBに依頼していた基板が届きました(図709.2)。

図%%.1
図709.1 CmodA7toPMODV5ボードガーバー図

図%%.2
図709.2 CmodA7toPMODV5基板

早速組み立てて動作させたところ、デバッグした後に正常に動作しました。図はPMODVGAインタフェース、PMOD I2Sオーディオインターフェース、PMODジョイスティックスイッチインターフェースの3つを接続した図です。外部電源5VでもUSBのみの電力でも動作するようです。

図%%.3
図709.3 CmodA7toPMODV5完成

左矢前のブログ 次のブログ右矢


ページ: