データサイエンティストの育成


情報・システム研究機構・統計数理研究所の椿広計所長に、アイソス2021年10月号から2022年3月号まで「データサイエンスへのアプローチ」というテーマで連載記事をご執筆いただきました。本稿は、その中から連載第5回「データサイエンティストの育成 〜日本の現状と課題〜」(2022年2月号)の記事全文を掲載しています。日本のデータサイエンス・AI教育に関する歴史・課題・期待が簡潔にまとめられた記事です。


日本の数理・データサイエンス・AI人材育成政策



政府の「AI戦略 2019」 では、「デジタル社会の基礎知識である数理・データサイエンス・AIに関する知識・技能、新たな社会の在り方や製品・サービスをデザインするために必要な基礎力など、持続可能な社会の創り手として必要な力を全ての国民が育み、社会のあらゆる分野で人材が活躍すること」を目指して、人材育成目標が設定されました。

第1は高校卒業生(年間100万人)が、問題発見・解決学習の体験等を通じてデータサイエンス・AIの基礎を習得し、新たな社会に資する創造性を涵養されること、第2は、データサイエンス・AIを理解し、各専門分野で応用できる人材を年間約25万人育成すること、第3は、データサイエンス・AIを駆使してイノベーションを創出し、世界で活躍できるレベルの人材を年間2,000人(世界トップクラス100人)育成すること、更に、データサイエンス・AIを現役社会人に対してリカレント教育(年間100万人)することです。

日本では、これ位のスピード感で人材育成を行わないと、世界に追いつけないという危機感が産官にあるのは事実です。



日本の産業界から学んだ海外のデータサイエンス教育とその逆輸入



米国は、1984年自動車等15製品分野で50%以上シェアを落とし、日本の製造業が何をやっているのかについて研究を開始しました。1988年にはベル研究所データ解析グループを中心とする視察団がトヨタを視察し、団長のBox教授は、「日本はやっている。我々はやっていない」と語りました。それが当時、全国約550万名の参加があったと推定されたデータに基づく改善と、第4回で強調した実験計画法などの産業界における活用です。2015年にデミング・石川の統計哲学を「産業界への最大の貢献」と述べたNair教授は、この調査団の若き一員でした。

1990年以降米国労働省は、「日本の労働者の70%が持っている能力を米国の労働者が持っていないのが自律的問題解決能力」と指摘するSCANS(The Secretary's Commission on Achieving Necessary Skills)レポートを順次発表し、学校教育転換の政策提言をしました。以来、欧米ではデータを使った問題解決能力が、小学校から大学院に至るまでの数学教育に取り込まれました。

その後、世界は製造業を復権するよりは情報サービスに基づく産業振興を重視します。2008年GoogleのChief AnalystのHal Varianは「実質的に無料のユビキタスデータを獲得できる時代となった今、今後12年間は統計家が最もSexyな仕事」とMcKinsey Quarterlyで発言し、初中等からの統計教育重要性も示唆しました。データが21世紀の原資であることが意識され、2009年IBMは、統計ソフトウェアSPSS社を買収し、予測型ビジネスなどサービス重視戦略を明確にしました。そして現在、Googleのようにデータを独占する巨大ビジネスが成立した訳です。

第1回で述べたようにデータに基づくソリューション形成を担う統計家、それを技術的にサポートするデータサイエンティストは、全米成長率トップランクの職種になり、教育体系も各国は整備しました。

1990年以降30年近く日本の産業界における改善活動や学校教育は停滞していたと言わざるをえません。統計学・統計家は日本では古びた響きなので、データサイエンス・データサイエンティストに衣替えして、データサイエンス教育が日本も必須との動きが逆輸入されたわけです。



数理・データサイエンス・AI教育が目指すべきこと



数理・データサイエンス・AIは、社会から見れば、課題達成や問題解決のツールに過ぎません。数理・データサイエンス・AIの個々のツール・戦術を使えるだけでなく、それらを貫く科学的問題解決のプロセスの知、問題解決学的側面、戦略を体得しない限り、社会の目的の達成はないでしょう。特に、実際の問題解決プロセスの中に、社会人としてのあるいは研究者としての「専門性」とデータから学習する新たな知識の価値とを有機的に統合し、問題解決で得られる経済価値の最大化に努めなければなりません。問題解決プロセスを科学的に表現する数理という「問題解決語」があり、それらを有機的に配置する統計学という「解決文法」があること、これが数理・データサイエンス教育の狙いです。そして人間が適切にそのプロセスマネジメントする前提で、プロセスの一部を自動化する技術としてAIがあることを教育者は強く意識すべきです。

その観点から、日本の学校教育で現在行われているデータサイエンス教育活動を見直してみます。前提となるのは日本では、データに基づく「問題解決」は、これまで学校ではほとんど教えてこなかったことです。製造業・マーケティング産業等の分野の問題解決に特化した組織内教育が主体だったのです。欧米が注目した「問題解決」教育をしたのは、製造業などで改善活動を行っていた組織です。



初中等統計教育の2011年改訂と困難



小中高校の学習指導要領の算数・数学に「資料の活用」という統計分野が10年ぶりに復活したのは、ゆとり教育から、「生きる力」が重視された2011年改訂時です。高校では、文理を問わず学ぶ数学Ⅰの記述統計的内容と、数学Bに「確率と統計」の内容が入りました。私も当時、どのような統計や確率の入試問題を出題すべきかなどを議論しました。また、初中等教育での統計の考え方の必要性を産業界と共に強く訴え、2011指導要領改訂をリードした渡辺美智子教授(当時、慶應義塾大学、現在立正大学データサイエンス学部)と共に、「問題解決学としての統計学〜すべての人に統計リテラシーを」を日科技連出版から出し、問題解決プロセス教育に期待もしました。この頃、初中等教育に英連邦圏から逆輸入された問題解決プロセスがPPDAC (Problem, Plan, Data, Analysis, Conclusion)サイクルで、総務省の「なるほど統計学園」 にも紹介されました。

しかし国立大学協会が、大学入試では「確率と統計」は出題しないと宣言し、「確率統計」の高校履修率は1%以下になりました。統計の授業は、期末試験等の後に行うといった学校も多々あったのです。統計も大学入試問題にすれば単なる計算問題としか見えないものになるのも事実です。ちなみに、アメリカでは、現実的なデータ解析を入試に出題し、計算機によるデータ解析を行わせるということも既に実施されていました。

こういった中で、西村圭一・東京学芸大学教授(数学教育)を中心とする小中高教員グループが、社会課題解決に資する実践的教育を目指す、入試とは異なる一意解の無い問題(Fermi問題)の学校教育導入運動を展開したことは特筆すべきことです。西村教授が、実践的数学教育教材をわが国に導入するために2010年に設立したBowland Japanの「アウトブレーク」という教材をご覧下さい。この教材は「ウイルス感染による病気拡大を阻止する科学者となり、感染者の発見につながる戦略を考え、ワクチンを開発し、ウイルスの拡大を最小限に抑えるためのワクチン接種計画をつくる」ものです。これは、英国で高校生を対象に2013年に開発された教材です。残念なことに、日本の高校数学教育では、生徒が教員と共にこの種の実問題解決をグループで議論し探究的活動よりも、一意解をもつ入試数学を効率的に解ける能力開発が重視される歴史が続いたことは認めざるを得ません。



初中等教育の2018年改訂への期待



文部科学省は2018年の指導要領改訂で、数学Ⅰだけでなく、確率を数学A、統計を数学Bに配置し、それを履修しないで済ませられないような工夫をしました。ICT技術と問題解決を結合する「情報」教育も高校で大幅に強化され、情報Ⅱにデータサイエンス・ツール教育も導入されました。高校教員用の教材は無償公開されていますが、一般の方にとっても優れたデータサイエンス教材です。

問題解決プロセスについては、調べ学習を超えた「理数探究」あるいは「総合的学習」といった活動の中で、小学生は小学生なりに身近な問題を解決し、高校生は高校生なりに地域社会の問題を解決する実践教育活動が強化されました。この探求型教育こそ、世界で重視されており、日本政府も充実を図ろうとしているSTEAM(Science, Technology, Engineering, Art, Mathematics)教育の真髄です。このSTEAM教育を貫く原理が、科学的問題解決プロセスであり、初中等教育で全ての国民が体得すべきことです。理科や社会といった基礎知識を前提に、日本の「問題解決型QCストーリー(改善の標準シナリオ)」、欧米Six-Sigma活動のDMAIC、あるいはPPDACといったプロセスに沿って問題を解決し、そのプロセスの各ステップに、数理・データサイエンス・AIをツールとして埋め込むのです。ツールも小学生なら素朴なグラフのような可視化ツールでしょうし、中高生なら記述統計、大学生なら重回帰分析などの初等的な統計モデル、一般社会人なら必要に応じて統計的機械学習(AI)という風に進化させなければなりません。第2回で示した全米ナンバー1のUCBデータサイエンスコースですら、質的予測の重回帰分析(ロジスティック回帰分析)から深層学習位の水準で、深層学習を除けば日本の統計的品質管理教育の範囲内です。

総務省統計局でも、「教育用標準データセット(SSDSE; Standardized Statistical Data Set for Education)」の開発がなされました。全国全ての市町村の200以上の最新の属性が示されるSSDSE-A、県単位で100変数以上の時系列データを収集したSSDSE-B、県庁所在地の家計消費データを集めたSSDSE-C、都道府県別の生活時間データを収集したSSDSE-Dが現在存在します。

SSDSEと他のデータを結合しデータ分析を行う「統計データ分析コンペティション」も2021年で第4回となりました。このコンペは高校生にもデータ分析に基づき、目的(先行研究)・方法・結果・解釈と結論を記述する論文を書かせます。高校生にとって先生方の指導は受けるものの、論文執筆するのは初経験ではないかと想像しています。私は、大学・一般の部(データサイエンス技術的には高い)よりも、素朴な方法で問題解決プロセスを展開する高校生論文に感動します。歴代の大臣賞や優秀賞の受賞論文をホームページで確認して下さい。受賞論文は校閲され、日本統計協会月刊雑誌「統計」に6頁掲載されます。2020年以降「高等学校データサイエンス教育研究会」の活動が、データサイエンス分野でSSH(Super Science High School)に指定された姫路西高校を幹事校として開始されました。ここに集う先生方は、このコンペティションでも上位に入賞する学校の先生方が多く、各校の論文などを互いに勉強し、どのようにしてデータに基づく探究的活動ができるかも検討していますし、産業界の問題解決プロセスを学習することも活発に行っているのです。



大学での数理・データサイエンス・AI教育の萌芽



2015年に滋賀大学に日本初のデータサイエンス学部が設立されました。その後、横浜市立大学、広島大学、長崎大学、武蔵野大学、立正大学など、続々とデータサイエンスの高等教育拠点が誕生しています。しかし、それは全日本という動きまでにはなっていません。

文部科学省・内閣府・経済産業省は連携して2020年に「数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル)」をスタートさせました。大学生が正規カリキュラムの中で、数理・データサイエンス・AIを適切に理解し活用する基礎能力育成を目的に体系的教育を行う大学教育プログラムを文部科学大臣が認定する事業です。次のステップの「応用基礎レベル」の認定も順次開始されます。2021年8月現在、78件のリテラシーレベル認定が行われました。また、その中で特に先導的で工夫を凝らしたプログラムとして11件(北海道大学、東北大学、筑波大学、千葉大学、滋賀大学、九州大学、山口東京理科大学、北海道医療大学、金沢工業大学、久留米工業大学、長岡工業高等専門学校)が選定されました。

東京大学を中心に数理・データサイエンス教育強化拠点コンソーシアムという大学横断のデータサイエンス研鑽の場が形成され、そこでは数理・データサイエンス・AIのリテラシーレベルや応用基礎レベル標準カリキュラムも公開しています。

もちろん、実問題解決というのは就職してから企業の実践で学べば十分、学生は高校でも大学でも基礎知識を学べば良いと考える日本人は多いと思います。小中高・大学の教員のみならず産業界でもそう思っている方も多々いるでしょう。データサイエンス時代、世界の学校教育が目指していることは、データに基づく科学的問題解決プロセスを社会の常識とすることです。各大学は認定のために多大な努力を払っていますが、プログラムを修了生がどう社会で活躍するか、産業界がどう処遇するかは日本のデータ駆動型産業勃興の鍵となるでしょう。逆に、産業界の問題解決プロセス教育を学校教育にどう注入するかも課題です。


【椿広計氏の連載概要】
・連載第1回「データサイエンスとは何か 〜日本の現状と課題〜」(アイソス2021年10月号掲載)
・連載第2回「データサイエンスの基盤としての統計科学」(アイソス2021年11月号掲載)
・連載第3回「産業界におけるデータサイエンス活用(事例:要因解析と予測、管理)」(アイソス2021年12月号掲載)
・連載第4回「データサイエンスにおける人工知能・機械学習の役割」(アイソス2022年1月号掲載)
・連載第5回「データサイエンティストの育成 〜日本の現状と課題〜」(アイソス2022年2月号掲載)
・連載第6回・最終回「まとめ:わが国のデータサイエンスをどのように進めてゆくか」(アイソス2022年3月号掲載)




執筆者: 椿 広計

大学共同利用機関法人情報・システム研究機構 統計数理研究所 所長
1982年東京大学計数工学修士課程修了後、東京大学計数工学科助手、慶應義塾大学理工学部講師、筑波大学経営システム科学専攻助教授・教授、同専攻長、統計数理研究所リスク解析戦略研究センター長を経て現職。現在、総務省統計委員会・サービス統計企業統計部会長、(一社)品質工学会会長、ISO/TC312国内審議委員会副委員長等。2021年デミング賞本賞を受賞。