【授業紹介】 正確なデータを作るためのデータサイエンスを学ぼう
立正大学データサイエンス学部 教授 高部 勲
■正確なデータを作るための技術
AI・データサイエンスの各分野では様々なデータを用いて、将来予測やデータの背後に潜む構造の把握を行うためのアルゴリズムが開発されています。しかし、それらのアルゴリズムに入力するデータが誤っていれば、そこから導かれる結論も誤ったものになってしまうおそれがあります。例えば、インターネット通販のデータを分析する際に、若い人に偏ったデータを使ってしまうと、若い人以外の行動が、分析結果に反映されない可能性があります。このように、扱うデータにバイアス(偏り)があることや、そのようなバイアスに起因して起こる問題のことを、「データバイアス」といいます。また、データバイアスにより、人工知能(AI)などの学習結果のアルゴリズムにもバイアスが生じてしまうことを、「アルゴリズムバイアス」といいます。
■アンケート調査の科学
このようなデータのバイアスの問題や課題に対応するためには、いかに正確で偏りのないデータを作成するかということを深く考え、其れを実現するために必要となる考え方や方法を学ぶことが重要になってきます。これについて、アンケート調査や世論調査などの「社会調査」の分野では、対象となる集団(母集団)を反映するような標本(サンプル)を適切に抽出し、その性質を正確に把握するための質問事項などの研究が行われています。こうした社会調査の理論や方法に関して、立正大学データサイエンス学部では、「社会調査の設計と実査」、「社会調査実習」などの授業を通じて学ぶことができます(社会調査実習におけるアンケート作成の演習、KJ法による論点整理の演習、Microsoft Formsを用いた調査票作成の演習など)
■社会調査士の取得を目指して
このようなアンケート調査などの方法を学び、社会調査の現場で必要な能力を持った社会調査の専門家であることを示す「社会調査士」という資格があります(一般社団法人「社会調査協会」が認定)。
立正大学データサイエンス学部では、資格認定に必要な科目を開講しており、これらの単位を取得し、大学卒業時に申請することにより、社会調査士の資格を取得することができます。情報社会の進展に伴い、調査の実施やデータの取得・分析に関する能力のみならず、分析結果を含めた調査やデータの妥当性を判断する能力も必要となっています。社会調査士の資格は、学生が、このような能力を持っていることをアピールする際に役立ちます。
この記事を執筆した教員のプロフィールはこちらからご覧になれます
立正大学データサイエンス学部情報
・立正大学データサイエンス学部HP・・・https://www.ris.ac.jp/ds/
・立正大学データサイエンス学部twitter・・・https://twitter.com/Rissho_DS
・動画コンテンツ(学部紹介や模擬授業など)・・・https://www.ris.ac.jp/ds/movlist/
立正大学データサイエンス学部紹介動画