見出し画像

DXへの道しるべ!第3回~研究開発部門が追い求める、機械学習の活用に“データプレパレーション”が欠かせないワケ~(DataRobotコラム)

前回から3回にわたってDXへの道しるべと題して、様々な業務・部門のDXを推進していくためのポイントをお届けします!

第1回目の記事はこちら

第2回目の記事はこちら

第3回目の今回は研究開発部門が追い求める、効率的な“最適化プロセス”を支援、機械学習の活用に“データプレパレーション”が欠かせないワケ
についてお送りします!

生産性が求められる研究開発部門の現在地

企業競争力を高める源泉を生み出すための研究や、技術開発を行っている研究開発部門では、知的財産としての技術獲得を行う基礎研究から、自社の事業推進に生かすための応用研究まで、様々な取り組みが行われています。例えば、食品業界では、新たな原料や包装などに関する基礎研究が行われており、その結果を受けて、効果の高い原料の抽出や応用していく食品の選択など、実際のビジネスに直結する応用研究につなげています。
業界によって取り組む研究内容は大きく異なりますが、マーケティング部門などが期待する販売・需要予測というよりも、多くのシミュレーションを実施しながら、最も適した配合や工程を見つけ出す、組合せの最適化といった高度なデータ分析アプローチが、研究開発部門のテーマとなるケースが一般的です。例えば、スチールを作るときに引張強度や降伏点、伸びの組合せが最善となる原材料比を見つけたい、伸びを同時最適にしたい、表面張力や粘度、濁度を同時に満足させる配合を調べたい。といったニーズが考えられます。
このような場合、これまでは研究者自身の経験や実績から仮説を立案し、その仮説を実証すべく、実験を繰り返していく必要がありました。そして、膨大な素材のなかから最適な組合せを見つけ出していくには、数多くの実験を繰り返していくプロセスが発生します。この仮説検証のプロセスは、研究開発において欠かせないものですが、昨今の景気動向も踏まえると、研究開発においても生産性が重視される傾向にあるのは、ご存じのとおりです。また、企業競争力を高めて競争優位性を確保するためにも、短期間のうちに結果を求められることも少なくありません。

“事実を理解する”ことで、最適化を目指す

そこで、最近注目されているのが、過去の実績データからパターンを学習した予測モデルを構築し、予測モデルを用いた組合せ最適化を行うことで、試行回数を減らすアプロ―チです。このアプローチに適した手法として、機械学習があります。既存のデータからコンピュータが自動で学習を行い…

~中略~

機械学習を活用するために欠かせない“前処理” の重要性

機械学習プラットフォームを活用する研究開発プロセスにおいては、最適化  モデルづくりに必要な、様々なデータを機械学習プラットフォームに投入します。そこからモデルづくりを経て検証していくことになりますが、そのモデルづくりに欠かせないプロセスがあります。それは、現場から得られたデータを、機械学習のモデルづくりに利用できる形へと結合・整形・クレンジング(洗浄)していく前処理です。
 モデルづくりに必要なデータは、自社内にある実験結果はもちろん、蓄えられた実験データや顧客先で使われた際の使用条件といった、フォーマットが異なるデータが数多くあります。これらをきちんと機械学習に活かせる形に整理していくことが必要ですが、この前処理に多くの時間を割かざるを得ず、本来時間をかけて試行錯誤すべきモデルづくりに時間をかけられないプロジェクトも少なくありません。実際には、モデルを開発する時間の何倍もの時間をかけてデータを準備するということも、現実的に発生しているのです。
 だからこそ、データの変換や加工、クレンジングといったデータプレパレーション処理(データの前処理)を効率的に実施することが、その後の工程で成果を生むためには重要…

この続きは下のリンクからダウンロードしていただくと続きを読むことができます。ぜひ登録して読んでみてくださいね!

★―☆。.:*:・゜――――――――――――――――――――――――

キヤノンITソリューションズ 公式Webサイト

関連製品ページ