研究内容紹介
コンピュータアーキテクチャの研究
AIアクセラレータSNACC
Convolutional Neural Network (CNN)などのAI技術は、今や我々の身近なサービスにも利用されるようになりました。CNNの実行は演算の処理量が多く、携帯端末などのエッジデバイスで実行する場合には演算性能の不足や消費電力の制約が問題となります。我々は、エッジ環境向けにCNN実行を高電力効率で実行可能なAIアクセラレータであるSNACC (Scalable Neural Accelerator Cores with Cubic-integration) を開発しています。SNACCは、無線通信によりLSIチップ間で通信するTCI (Thru-Chip Interface)技術を搭載し、複数LSIを3次元に積層することで性能をスケーラブルに拡張できるという特徴があります。
Processing-In-Memoryアーキテクチャ
科学技術計算やAI処理など、多くのアプリケーションは演算処理よりもメモリアクセスがボトルネックとなり、性能があがりません。そこで、メモリの内部、あるいは極近傍で計算処理を行うProcessing-in-Memory (PIM)のコンセプトが注目を集めています。簡単な処理は、プロセッサではなくメモリ側で行うことでメモリアクセスにかかる時間や電力を抑えることが可能です。本研究室では、SRAM内部でデジタル演算を行いAI処理を加速するアーキテクチャや、加速機構のプログラミングとして広く用いられているGPUプログラミングによりPIMを効率的に制御する手法などを研究しています。
ニューラル組み合わせ最適化
脳型計算による経路探索手法
倉庫内や工場で物の運搬を担うAGVや、将来の技術として期待される自動運転ロボタクシーなど複数のエージェントが協調しつつ、お互いの衝突や渋滞をおこさずに経路やタスクの割り当てを最適化する問題には社会において重用な一方、組み合わせ数が膨大なため現実的な時間で良い解を探索するのは難しいとされています。そこで、強化学習を利用してこれらの最適化問題を高速に解く手法を検討しています。
AIによるナーススケジューリング問題の解法への挑戦
ナーススケジューリング問題は、多くの数で複雑な制約を持つ勤務表へのシフトの配置を扱う問題であり、組み合わせ最適化問題の中でも良い解を導き出すのが難しいとされている問題の一つです。本研究室では、強化学習を利用して解を導出する手法や、言語モデルを応用して人の思考を細かく取り入れつつ複雑な制約を満たすよう解を生成するAIのファインチューニング手法の研究に取り組んでいます。
クライオジェニック(極低温)コンピューティング
量子コンピュータ向けの超伝導回路による量子誤り訂正手法
量子的な現象を利用した量子コンピュータは様々な分野での活用が期待されるため、世界で盛んに開発が進められていますが、その実用化においては計算を行う素子である量子ビットにエラーが生じやすいため、エラーを修正しながら計算する誤り耐性技術の開発が必要とされています。我々は高速・低消費電力で動作する超伝導回路を用いて、極低温環境で動作可能な復号器を開発しています。特に、量子ビットにエラーが生じると即座に訂正を行うことでエラーの蓄積を防ぐオンライン復号を世界で初めて提案しています。この手法により異なる温度環境間の配線を減らし、量子コンピュータのスケーラビリティを飛躍的に向上させることができると期待されます。
ハイパフォーマンスコンピューティング
次世代スーパーコンピュータのアーキテクチャ探索
スーパーコンピュータを用いたシミュレーションは気象予測や創薬、ものづくり、そしてAI技術など様々な分野で利用されています。より高度で正確なシミュレーションに向けて、アプリケーションはより高い性能を要求しています。そのためには、最先端の技術を結集して大規模システムを構築するためのアーキテクチャの研究は欠かせません。現在世界一位の性能を誇るスーパーコンピュータ「富岳」の次世代にあたるシステムの開発を目指して、その要素技術の調査やアーキテクチャの探索、アプリケーションとのコデザインに関して研究をしています。この研究は、理化学研究所計算科学研究センターの次世代高性能アーキテクチャ研究チームにおいて中心的に行っています。
スマート社会のためのCPS (Cyber Physical Systems)技術応用
エッジ・クラウド連携処理基盤
エッジコンピューティングでは、その時々の状況や場所などの環境条件に合わせて処理をすることが必要になりますが、性能やQoSへの要求も状況に応じて変化します。そのようなアプリケーションの例として人の行動追跡や交通網、ヘルスチェッキングなど多様なものがありますが、関連性などを表現可能なグラフデータ構造で扱われるものが多くあります。我々はグラフ処理やグラフデータ構造を利用するアプリケーションを対象に、エッジ・クラウドを連携させた処理基盤について研究を行っています。
強化学習によるIoTシステム最適化
IoT時代に重要な役割を果たすセンサなどのエッジデバイスは、小規模なバッテリー駆動、あるいは環境発電を利用することが多く、長時間稼働のためには効率的に電力を管理しつつ処理を行うことが求められます。我々は、環境発電を利用する無線センサーノード(Energy Harvesting Wireless Sensor Node: EHWSN)を対象に、強化学習を用いた自律的電力制御手法を研究しています。強化学習により、センサデバイスが置かれた環境に特化して自身で最適な電力ポリシーを学習できるため、膨大な数のセンサーデバイスの個々に最適化する必要がありません。今後のIoT時代に強化学習を利用したシステム最適化は有効な手法になると考えられます。
オンデバイス学習による異常検知
機械学習技術は様々な応用で利用可能な一方で、高い精度を得るには多数の教師付きデータが必要です。エッジで得られるセンサーデータは、たとえ応用領域や対象が同じであったとしても環境に応じて異なることも多く、全ての環境で教師データを集めることは困難です。そこで異常検知を対象に、我々は教師データを必要とせず環境に設置するだけで自身が学習を進め、正常と異常を判別するオンデバイス学習技術を研究しています。これまでに、機器の振動の異常や防犯カメラによる異常行動の検出、サイバーセキュリティの攻撃検知などへと応用し、その効果を実証しています。この研究は、慶應義塾大学情報工学科の松谷研究室と共同で実施しています。