機械装置の稼働率を高める監視技術、アナログ・デバイセズのAIで音の意味を把握する（アナログ・デバイセズ株式会社）のカタログ無料ダウンロード | Apérza Catalog（アペルザカタログ）

ホワイトペーパー

機械装置の保守の必要性を実感している人であれば、装置が発する音や振動がいかに重要な意味を持つか知っています。音や振動を利用して適切に装置の状態を監視することにより、装置の保守にかかるコストを1 /2に削減し、寿命を2倍に延伸することができます。状態基準保全（Conditional Based Maintenance）向けのシステムを実現する上では、音のライブ・データを収集／解析する手段を実装することが、1つの重要なポイントになります。

本稿では、装置の状態監視を行うためのアーキテクチャ／プラットフォームである「OtoSense」について解説します。OtoSenseは、「コンピュータ聴覚（Computer Hearing）」という機能を実現します。この機能は、装置の状態を表す音と振動を主な指標とし、その意味をコンピュータによって解釈するというものです。

★詳細は、記事をダウンロードしてご覧ください。

ドキュメント名	機械装置の稼働率を高める監視技術、アナログ・デバイセズのAIで音の意味を把握する
ドキュメント種別	ホワイトペーパー
取り扱い企業	アナログ・デバイセズ株式会社 (この企業の取り扱いカタログ一覧)

多軸ロボットや工作機械におけるタイミングの問題を解決する

製品カタログ

アナログ・デバイセズ株式会社

【技術記事】5Gが様々な産業分野のミリ波技術を推進

その他

アナログ・デバイセズ株式会社

過酷な産業環境におけるタイム・クリティカル通信用の堅牢なイーサネット物理層ソリューション

ホワイトペーパー

アナログ・デバイセズ株式会社

Page1

Analog Dialogue 53-04、2019年4月 Share on Twitter Facebook LinkedIn Email 機械装置の稼働率を高める監視技術、アナログ・デバイセズのAIで音の意味を把握する著者: Sebastien Christian はじめに本稿では、まずO t o S e n s eの開発方針について説明しま機械装置の保守の必要性を実感している人であれば、装す。続いて、設計に際して参考にした人間の聴覚の仕組置が発する音や振動がいかに重要な意味を持つか知ってみについて詳しく解説します。そのうえで、音または振います。音や振動を利用して適切に装置の状態を監視す動の特徴（F e a t u r e）を表現する方法、それらから意味ることにより、装置の保守にかかるコストを 1 / 2に削減を導出する方法を紹介します。最後に、より高い精度でし、寿命を2倍に延伸することができます。状態基準保全より複雑な診断を実行できるように、時間の経過に応じ（Condi t iona l Based Main tenance）向けのシステムを実てOtoSenseを進化／改善するための継続的な学習プロセ現する上では、音のライブ・データを収集／解析する手スについて説明します。段を実装することが、1つの重要なポイントになります。開発方針そうしたシステムでは、まず装置の正常な稼働音を把握堅牢かつアグノスティックで効率的なシステムを構築すします。音に変化が生じたら、それを異常として検知しるために、OtoSenseは以下に示すいくつかの方針に基づます。その結果、問題を特定することができれば、そのいて設計しました。音を特定の問題と関連づけられます。異常の検知は、わずか数分のトレーニングで行えるようになります。た XX 神経学から着想を得る：人間は耳にする任意の音を学だ、音や振動をその原因と結び付けて診断できるように習し、それに意味を持たせることができます。また、なるまでには、かなりの時間を要します。そのような知非常に高いエネルギー効率でそれを行います。識を身につけた経験豊富な技術者は存在しないわけでは XX ありません。しかし、決して多くはありません。音だけ定常音と過渡音を学習できるようにする：これには、で問題を直感的に認識するというのは、蓄積されてきた適切な特徴の抽出と継続的な監視が必要です。記録や詳しく解説された枠組みがあったり、専門家から XX センサーの近くのエッジで認識を実行する：リモー個人的な指導を受けたりしたとしても、難易度が高い可ト・サーバとのネットワーク接続を必要とすることな能性があります。く、判断が行えるようにします。 XX 専門家に負荷がかからないようにする：専門家と意見そこで、筆者が所属するアナログ・デバイセズでは、このを交換したり、専門家から学んだりする必要が生じた 20年間、人間が音や振動の意味を理解する仕組みを解明場合に、専門家の日々の仕事量に及ぼす影響を最小限すべく、取り組みを進めてきました。その目的は、装置のに抑えます。また、そうしたやり取りの過程を楽しい音や振動を把握し、その意味を解釈して異常な動作を検出ものにするよう努めます。できる診断システムを構築することでした。本稿では、装置の状態監視を行うためのアーキテクチャ／プラットフォ人間の聴覚システムをOtoSenseに変換ームである「OtoSense」について解説します。OtoSense 人間の聴覚は、生存を維持するために備わっている感覚は、「コンピュータ聴覚（Computer Hear ing）」というです。この感覚は、遠方で生じた事象や目に見えない事機能を実現します。この機能は、装置の状態を表す音と象を全体的に捉えるためのものであり、生まれる前の段振動を主な指標とし、その意味をコンピュータによって階で成熟します。解釈するというものです。人間が音に意味を持たせるプロセスは、アナログでの音 OtoSenseをベースとするシステムは、任意の装置に適用の取得、デジタル信号への変換、特徴の抽出、解釈とい可能です。また、ネットワークに接続することなく、リう4つのなじみ深いステップで表すことができます。以アルタイムに動作します。産業用アプリケーション向け下では、各ステップについて、人間の耳とOtoSenseベーに構築されており、装置の状態を監視するためのスケースのシステムを対比して説明します。ラブルで効率的なシステムを実現できます。 analog.com/jp/analog-dialogue 1

Page2

XX アナログでの音の取得、デジタル信号への変換：人間音と振動から特徴を抽出は、中耳の鼓膜と耳小骨によって音を取得します。そ特徴には、一定の時間（時間ウィンドウ、つまりはチャのうえで、インピーダンスを調整し、リンパ液で満ンクで決まる）における音または振動の属性／質を表すたされた蝸牛に振動を伝達します。蝸牛管内の基底膜番号が割り当てられます。OtoSenseは、以下の方針に従は、信号に含まれる周波数成分に応じて選択的に変位って特徴を選択します。します。その結果、柔軟な細胞が屈曲し、その曲がり具合と強さに応じたデジタル信号が出力されます。個 XX 特徴は環境を表すものでなければならない：特徴は、々の信号は、周波数成分ごとにふるい分けられ、平行周波数領域と時間領域の両方において、できるだけ完する神経経路を通って1次聴覚野に到達します。全かつ詳細に環境を表すものであることが必要です。 • O t o S e n s eでは、センサー、アンプ、コーデックに「ブーン」、「カチカチ」、「ガタガタ」、「キーキよって、上記の内容と同等の処理を行います。デジー」といった定常音と、任意の種類の過渡的な不安定タル信号への変換処理には、2 5 0 H z～ 1 9 6 k H zの範性を表せるものでなければなりません。囲で調整可能な固定のサンプル・レートを使用しま XX 特徴は、できるだけ直交した集合を構成しなければなす。信号は16ビットで符号化され、128～4096個のらない：例えば、1つの特徴が「チャンク内の平均振サンプル・データがバッファに格納されます。幅」として定義されている場合、「チャンク内の合計 XX 特徴の抽出：1次聴覚野において、支配的な周波数、スペクトル・エネルギー」といった具合に、それと強高調波、スペクトル形状といった周波数領域の特徴く相関を持つ別の特徴が存在してはなりません。当然と、約3秒間の時間ウィンドウ内における衝撃、強度のことながら、完全な直交性は達成できませんが、他の変動、主要な周波数成分といった時間領域の特徴がの特徴の組み合わせとして表現される特徴が存在する抽出されます。のは許されません。言い換えれば、各特徴には何らか O t o S e n s e C h u n k の特異な情報が含まれている必要があります。• では、チャンク（）と呼ばれる固定のステップ・サイズで移動する時間ウィンドウを XX 特徴は、演算を最小限に抑えられるものでなければな使用します。チャンクのサイズとステップは、認識らない：人間の脳にできるのは、加算、比較、ゼロしなければならない事象とサンプル・レートに応じへのリセットだけです。O t o S e n s eのほとんどの特徴て23ミリ秒～3秒の範囲内で設定され、特徴はエッは、インクリメント変数として設計されています。新ジで抽出されます。O t o S e n s eによって抽出されるたなサンプルが加わるごとに、特徴は単純な演算によ特徴については、次のセクションで詳しく説明しまって変更されます。そのため、チャンク全体はもちろす。ん、バッファ全体を対象として特徴を再計算する必要はありません。演算の最小化は、標準的な物理単位に XX 解釈：解釈が行われる連合野は、すべての知覚と記憶ついて配慮する必要がないということも意味します。を融合し、言語などによって音に意味を付与します。例えば、強度を表すのにdBAを単位とする値を使う必つまり、人間の知覚を形成する上で非常に重要な役割要はありません。そうした値が必要であれば、出力すを果たします。解釈は、事象に対して単に名前を付ける際にそのための演算を行うだけで済みます。るだけの作業ではありません。それをはるかに超えた描写を整理するプロセスです。事柄、音、出来事などに名を付与することで、人間はそれらに対してより深 OtoSenseでは、時間領域に対応する2～1024の特徴を扱く重層的な意味を与えることができます。名称や意味います。それらは信号から直接抽出されるか、またはチによって、専門家はその環境についてより深く理解でャンク内の他の特徴から導出されます。それらの特徴にきるようになります。は、平均または最大の振幅、信号の線形長から導出した複雑さ、振幅の変動、衝撃の存在とその特性、最初と最 • O t o S e n s eと人間の相互作用が、人間の神経学に後のバッファ間の類似性としての安定性、畳み込みを行基づき、教師なし（U n s u p e r v i s e d）の視覚的な音わない状態での皮相的な自己相関、主要なスペクトルの声マッピングから始まる理由はここにあります。ピークの変動などが含まれます。 O t o S e n s eは、取得したすべての音や振動をグラフィカルに表現し、類似性に基づいて分類します。周波数領域で使われる特徴は、FFT（高速フーリエ変換）但し、厳密なカテゴリを設けようとはしません。の結果から抽出されます。FFTの演算はバッファ単位で行そのため、専門家は、有界のカテゴリを人工的に作われ、128～2048の周波数成分が生成されます。続いて、成することなく、画面上に表示された分類集合を必要な次元数のベクトルを作成します。次元数は、当然の整理して命名することができます。また、専門家はことながら、FFTのサイズよりもはるかに小さいわけです O t o S e n s eの最終出力に関する自らの知識、知覚、が、環境を包括的に表現することができます。OtoSense 期待に合致したセマンティック・マップを構築するでは、まずアグノスティックな方法により、対数スペクことが可能になります。自動車の整備士、航空宇宙トルに対する等サイズのバケットを作成します。続いて、分野の技術者、冷間鍛造プレスの専門家といった分環境と識別したい事象に応じてエントロピを最大化する野ごとに、あるいは同じ分野でも企業ごとに、同じ教師なしの観点、またはラベル付けされた事象を指針とサウンドスケープが異なる形で分割、整理、ラベルして利用する半教師あり（S e m i - s u p e r v i s e d）の観点の付けされる可能性があります。O t o S e n s eは、人間うちいずれかに基づき、情報の密度が高いスペクトル部が言語を使用するのと同様に、ボトムアップのアプ分に焦点が絞られるようにバケットを調整します。これローチで意味を形成します。は、音声情報が最大の部分で密度が高くなる、人間の内耳細胞の構造を模倣したものです。 2 Analog Dialogue 53-04

Page3

アーキテクチャ：エッジとオン・プレミスの入力された音や振動が正常な場合のものかどうかを評価データに力を与えるする際には、以下に示す異なる2つの戦略を適用します。 OtoSenseによる異常値の検出と事象の認識は、リモート X 1つ目の戦略は、正常性と呼ばれるものです。特徴空のアセットを全く利用することなくエッジで行います。間に新たに入力された音について、その環境、基準点このようなアーキテクチャであることから、システムはやクラスタとの距離、クラスタの大きさを確認しまネットワーク障害の影響を受けません。また、分析を行す。距離が遠く、クラスタが小さいほど、その音の異うためにすべての未加工データを送信する必要がなくな常性は高く、異常値のスコアは高くなります。異常ります。O t o S e n s eの処理を実行するエッジ・デバイス値のスコアが、専門家が定義した閾値を超えている場は、音を使ってリアルタイムに装置の問題を把握する自合、該当するチャンクは「異常」としてラベル付け己完結型のシステムとなります（図1）。され、専門家が確認できるようにサーバに送信されます。通常、 A I（ A r t i f i c i a l I n t e l l i g e n c e：人工知能）と H M I（H u m a n M a c h i n e I n t e r f a c e）の機能を実行する X 2つ目の戦略は、とてもシンプルなものです。チャン OtoSenseのサーバは、オン・プレミスの形で運用されまクに対する入力の特徴の値が、基準を定義する全特徴す。意味のある複数のデータ・ストリームをOtoSenseにの最大値を上回るか最小値を下回る場合、そのチャン対応するデバイスの出力としてまとめるという目的に対クは「極度の異常」としてラベル付けされ、サーバにしては、このクラウド・コンピューティングのアーキテ送信されます。クチャが合理的な選択肢となります。OtoSenseのAIは、大量のデータを処理して1つのサイト内にある数百台のデ「異常」と「極度の異常」の2つを組み合わせることによバイスとやり取りするだけです。この目的に対して、ホり、異常な音や振動を十分に網羅し、漸進的に進行する摩スティング型のクラウド・コンピューティングを利用す耗と、予期せぬ過酷な事象を検出することができます。るのはあまり意味がありません。特徴に基づく事象の認識特徴に基づく異常の検出特徴は物理的な領域に属し、意味は人間の認識力に属しま正常か異常かの評価には、さほど専門家が介入する必要す。特徴と意味を関連づけるためには、OtoSenseのAIとはありません。専門家の介入が必要になるのは、装置の人間である専門家の間の相互作用が必要になります。当社正常な音と振動の基準を確立する際だけです。その基準は、かなりの時間を費やして顧客からのフィードバックをが、OtoSenseのサーバで使用する異常値のモデルに変換取り入れ、技術者がOtoSenseと効率的にやり取りして、され、デバイスに適用されます。事象の認識モデルを設計することを可能にするHMIを開発しました。このHMIを使えば、データの調査を行い、ラベル付けを実施し、異常値のモデルと音の認識モデルを作成し、それらのモデルのテストを行うことができます。学習モードにおける未加工データとコンテキスト。検出モードについてはオプション／カスタム OtoSenseのサーバ OtoSenseのエッジ・ノード学習ローカルのクロー解釈ローカルのクロー相互作用ズド・ネットワーク事象の識別を介して接続異常の検出ズド・ネットワーク最適化を介して接続通知ロギングプロビジョニング、認識モデル、異常値のモデル、ファームウェアのアップデート（すべて非同期）図 1 . O t o S e n s eをベースとするシステム Analog Dialogue 53-04 3

Page4

「OtoSense Sound Pla t te r」（sp la t te rとも呼ばれます）異常値に対しては、一定の時間内のすべての異常音と極を使えば、データ・セットの包括的な概観を把握しつつ、度な異常音を表示するインターフェースを介して、調査音の調査とタグ付けを行うことができます。spla t te rは、とラベル付けが行えます（図5）。データ・セット全体の中から関心を持つべき代表的な音を選択し、ラベル付けされた音とされていない音が入り混じった2次元の類似性マップとしてそれらを表示します（図2）。図 5 . 時系列での音の分析。O t o S e n s eにおいて異常値を視覚化することで実現しています。図 2 . O t o S e n s e S o u n d P l a t t e rによる 2次元マップ（sp l a t t e rマップ）異常の検出から、より複雑な診断までの継続的な学習プロセス OtoSenseでは、任意の音または振動を、コンテキストと O t o S e n s eは、複数の専門家から学習し、時間の経過に共にいくつかの異なる方法で視覚化することができます。伴って、より複雑な診断ができるように設計されていまその1つは「Sound Widget」（swidgetとも呼ばれます）す。通常のプロセスは、OtoSenseと専門家の間の再帰的を使用する方法です（図3）。ループによって行われます。その詳細は以下のようなものになります。 XX 異常値のモデルと事象の認識モデルはエッジで実行されます。それらによって、異常値のスコアと共に、潜在的な事象が発生する確からしさを表す出力が生成されます。 XX 定義された閾値を超える異常な音または振動によって、異常値の通知がトリガされます。これを受けて、O t o S e n s eを使用する技術者は、その音とコンテキストを確認することができます。 XX 続いて、技術者は、その異常な事象にラベル付けを行います。 XX その新たな情報を含む新たな認識モデルと異常値のモデルが計算され、エッジ・デバイスに送られます。図 3 . O t o S e n s eの S o u n d W i d g e t（ s w i d g e t）まとめまた、異常値のモデルまたは事象の認識モデルは、任意アナログ・デバイセズのOtoSenseは、任意の装置に対しの時点で作成できます。事象の認識モデルは、円形の混て音と振動に関する専門的な知見を継続的に提供し、ネ同行列として表現されます（図4）。OtoSenseのユーザットワークに接続することなく、異常値の検出と事象のーは、それを使用することにより、混同事象について調認識を実施できるようにすることを目的としたものです。査することができます。この技術は、航空宇宙、自動車、産業の各分野において、装置の状態監視向けに広く採用されつつあります。かつては人間の専門的な知見を必要とし、特に複雑な装置に関しては組み込みアプリケーションが必要だった環境において、優れた実績を積み重ねています。参考資料 Sebast ien Chris t ian「How Words Create Worlds（言葉が創り出す世界）」TEDxCambridge、2014年図 4 . 必要な事象に基づいて作成された事象の認識モデル 4 Analog Dialogue 53-04

Page5

Sebastien Christian 著者： Sebas t ien Chr is t ian（sebas t ien .chr i s t ian@analog .com）は、アナログ・デバイセズでの製品化に向けて、OtoSenseの開発を統括しています。 Chr i s t i anはかなり早い時期から「人間が自らの感覚を利用して、世界の内面モデルを共有可能なものとして構築し、そのモデルを使って人間が住む世界を表現する方法を理解したい」と強く願っていました。量子物理学の修士号に続いて神経科学の修士号を取得した後、セマンティクスに関する学位も取得しています。これらの分野において、研究、開発、フィールド実験を融合した形で学問を修めてきました。その後、精神障害や聴覚障害を抱える子供を対象とする発話と言語の病理学者として、10 年間就業しました。それを通して、センサーをベースとし、聴覚に重点を置いて意味の形成／共有を実現する手法について理解を深めていきました。Chr i s t i anは、「若い患者たちと何年も向き合った当時の経験によって、ばらばらだった知識のかけらのすべてが首尾一貫した1つの形にまとまった」と述べています。同じ時期に、フランス保健省のエキスパートとなり、難聴に関する制度に対して助言を行っていました。医科大学やパリ・ソルボンヌ大学で教鞭を取り、2011年には、知覚障害や認知障害を抱える人々に対し、AIに基づくイノベーションをもたらすことを専門とする初の独立系民間R&D 施設を創設しました。 2013年には、機械聴覚（Machine Hear ing）プロジェクトにおいて完全なプロトタイプを完成させ、米マサチューセッツ州ケンブリッジで行われた技術コンペティション「NETVA」で賞を授与されました。MIT（マサチューセッツ工科大学）の同僚や産業界からかなり好意的なフィードバックを得たことを受けて、2014年初頭にOtoSenseを創設しました。そして、任意の音に意味づけすることに焦点を絞った初のAIを開発しました。機械聴覚に対応するこのプラットフォームは、複雑な環境や複雑な機械の監視にうまく適応できるということが明らかになりました。開発したAIは、2015年の「GSMA Mobi le Wor ld Congress」において、「Best App of the Year」を受賞しました。その他にいくつかの賞を授与された後、OtoSenseの開発は、産業分野と輸送分野における機械の監視に焦点を絞って進められるようになりました。その先にある広範かつ潜在的な用途への展開も見据えています。 Analog Dialogue 53-04 5

動機*	具体的な検討のため情報収集のため
この内容をご存知でしたか？	詳しく知っていた名前だけは知っていた知らなかった
導入予定時期を教えて下さい	1ヵ月以内3ヵ月以内6ヵ月以内1年以内未定
あなたの立場を教えて下さい*	自社での導入を検討する立場顧客に提案・販売する立場
お問い合わせ・ご質問

動機
この内容をご存知でしたか？
導入予定時期を教えて下さい
あなたの立場を教えて下さい
お問い合わせ・ご質問

お名前
電話番号
会社名
事業所名
部署名
業態
職務区分
所在地

機械装置の稼働率を高める監視技術、アナログ・デバイセズのAIで音の意味を把握する

装置の状態監視を行うためのアーキテクチャ／プラットフォームである「OtoSense」について解説します

このカタログについて

この企業の関連カタログ

このカタログの内容

機械装置の稼働率を高める監視技術、 アナログ・デバイセズのAIで音の意味を把握する

装置の状態監視を行うためのアーキテクチャ／プラットフォームである「OtoSense」について解説します

このカタログについて

この企業の関連カタログ

このカタログの内容

機械装置の稼働率を高める監視技術、アナログ・デバイセズのAIで音の意味を把握する