データ流通とは何か


一般社団法人データ社会推進協議会(DSA) 代表理事・事務局長であり、シリコンバレーに拠点を置くEverySense,Inc.のCEOでもある眞野浩氏に、アイソス2021年10月号から2022年3月号まで「日本が取り組むべきデータ流通の制度化と標準化」というテーマで連載記事をご執筆いただきました。本稿は、その中から連載第1回「データ流通とは何か なぜこれが日本のビジネスチャンスになるのか」(2021年10月号)の記事全文を掲載しています。データとは何か、データ社会・データ流通とは何かをやさしく解説しながら、なぜこれがビジネスチャンスになるのかについて言及しています。


1. 序文



本年9月には、デジタル庁が創設され我が国におけるデジタル社会への取組みも急速に各方面で推進されつつあります。このような中、筆者らは一般社団法人データ社会推進協議会(Data Society Alliance:以下DSAと記す)を設立し、我が国におけるデジタル社会の推進に向け産学官を超えた連携を進めています。

さて、デジタル社会を構築する上では、誰でもが必要データを適切に活用できることが重要になること、そこに注目し私たちは「データ社会」という言葉を掲げています。必要なデータを、必要な人が必要な時に使えるための仕組みが「データ流通」です。ところが、データがもつ性質やその扱いは、従来の有体物とは異なることから、おのずと多くの制度上の課題やシステム構築上の課題があります。そこで、この連載では、「日本が取り組むべきデータ流通の制度化と標準化」というテーマのもと、6回にわたり解説をしたいと思います。



2. データ社会とデータ流通の定義



連載にあたり、まずデータ社会やデータ流通とは何かということを解説します。

2.1 データ社会とは

デジタルトランスフォーメーション(DX)という言葉は、今や新聞や雑誌、ネット記事に毎日のように登場しています。ご承知のようにアナログからデジタルへという転換は、電子計算機の登場以降、日々さまざまな分野で起こってきた事象ですから、いまさらデジタル化と言われても、そこになんら新しさはないかもしれません。時刻を数字で表すデジタル表示の腕時計が1970年台には登場していますし、機械式のものは、そのはるか以前からあります。つまり、連続したアナログ値を離散的なデジタル値に変換し、取り扱うことをデジタル化というのであれば、それはすでに私たちの社会のあらゆる分野で行われています。

しかし、デジタルトランスフォーメーション(DX)が目指すデジタル社会とは、このような単純なデジタル化ではありません。私たちの存在する実空間におけるさまざまな事象をデジタル化し、これを処理する仮想現実や人工知能などを含む仮想空間と連携することで、より複雑で高度な問題を解決し、そこに住む人間がより豊かな生活を得ることこそが目指すデジタル社会です。

さて、このような実空間と仮想空間の融合したシステムは、CPS(Cyber-Physical System)と呼ばれます。ここでCPSにおいて実空間と仮想空間を行き来できるものは、まさにデータに他なりません。つまり、デジタル社会を実現するには、アナログ事象をデジタル化するだけでなく、そのデジタル化された情報が様々なシステム間を縦横無尽に行き来することが重要になるわけで、このデジタル化された情報の流通こそがデータ流通です。そして、データ流通が円滑に行われ、誰でもが必要な時に必要なデータを活用できる社会がデータ社会です。

2.2 データとは

この連載にあたり、まずはデータ(data)とは何かについて、共通の定義を示したいと思います。

データとは、ISO/IEC 2382-1:1993では、“A reinterpretable representation of information in a formalized manner suitable for communication, interpretation, or processing”と定義されています。これは、直訳すれば、「通信、解釈、処理に適した形式化された方法で、情報の再解釈可能な表現」ということです。つまり、データは情報を構成するための要素と理解できます。逆に言えば、情報はデータを含む上位概念ということです。

なお、“情報”は「事実、事象、事物、過程、着想などの対象物に関して知り得たことであって、概念を含み、一定の文脈中で特定の意味をもつもの」(ISO/IEC 2382-1, JIS X 0001)という定義がありますので、この中にデータが含まれることになります。

つぎに、私たちがよく使う言葉に、“データセット(dataset)”という用語があります。これは、ISO 19115-1:2014, 4.3では、“Identifiable collection of data”とあり、「識別可能なデータの集合体」ということですから、データが集まったものです。ちなみに、英語のデータ(data)は、 データム(datum)の複数形ですから、データというのは、少なくとも複数の値が含まれることになります。これらの包含関係を、整理すると図表1のようになり、データは様々な処理により情報、知識へとその付加価値を上げていくことになります。



さて、データを扱う上で、もう一つよく使われる用語に“メタデータ(metadata)”があります。これも、ISO/IEC 11179-1:2015では、“Data that define and describe other data”とあり、「他のデータを定義・記述するデータ」ということになります。ですから、metadataは、データの種類の一つです。また、同様にデータセットの定義や内容を説明する情報をメタ情報と言います。

私たちに馴染みのある表形式のデータセットでは、一行目に各列のデータの意味が文字列などで示されていますが、そのデータ自体は、まさに他のデータの定義をしているため、メタデータとなります。これは、同様にJSONでのデータ転送では、メタタグとして他のデータの内容を示している部分がメタデータとなります。これらの関係を図表2に示します。



2.3 データ生成とは

さて、2.2にデータとは何かを明確に定義を示しましたので、次にデータ生成(データ化)についての定義を示したいと思います。2.2のデータの定義を前提とすると、以下のように定義できるかと思います。

“データ生成(データ化)とは、自然や自然人、組織などの状況や活動を、観測または計測し、これを通信、解釈、処理に適した再解釈可能な形式化のことである。”

このようにプリミティブな定義をまとめると、データというのは、あらゆる分野、あらゆる場面で生成可能であることが分かると思います。

2.4 データ流通とは

データ生成という行いで得られたデータは、より多くのデータや、より多様なデータと組み合わせることで、新しい知見や成果を創出することができます。

ここで、多種多様、大量のデータを、個々の組織や人がデータ生成することには、おのずと限界があります。例えば、全国の都道府県の気温データを、自らが全国に温度計を設置して、測定するということは非現実的です。ここで重要になるのが、他の人や組織が生成したデータを利用することです。また、データは、他のデータとの組み合わせや、様々な加工をすることにより、新たなデータとなります。

つまり、データは、異なる組織や人の間で、伝送されていくことになりますが、このことこそがデータ流通ということになります。

2.5 データの特徴とオーナーシップ

データの大きな特徴の一つは、データは無体物であり、民法上、所有権や占有権、用益物権、担保物権の対象とはならないことです。このため、所有権や占有権の概念に基づいてデータに係る権利の有無を定めることはできないと解釈されています(民法206条、同法85条参照)。ただし、知的財産権として保護される場合や、不正競争防止法上の営業秘密として法的に保護されることは可能ですが、その場合でも、財として保護することは相当に限定的です。また、日本では、「データ・オーナーシップ」という言葉の法的な定義が法文化されていません。

2.6 データの流通の実態

さて、では実際にはどのようにデータの流通とその権利保護は、成り立つでしょうか? データがAからBに流通する場合、現在は原則として利害関係者間の契約を通じて、流通の合意と流通後の利用方法などを取り決めています。つまり、データの権利保護については、当事者間の個別契約行為により行われています。

しかし、データは無体物であるとともに、排他的な所有ができない点に注意が必要です。データが提供者から第三者に流通した場合、データは提供者にも第三者にも残ることになります。実態は移動させずアクセス権を管理する場合であっても、たとえばスクリーンショットを撮ることは可能であり、一時的にせよ提供者と第三者に同時にデータは存在します。もちろん、契約で移転後の使用や保存媒体の抹消などを明確にすることも可能ですが、有体物のようにデータ流通では、唯一無二の実態が流通するわけではありません。

すなわち、データ流通というのは、「データのすべて、または一部の写像が、約定とともに流通する」ということです。



3. データ流通と日本型ビジネス



ビッグデータが様々な新しいビジネスを生み出すことは、すでにGAFAM(Google、Amazon、Facebook、Apple、Microsoft)と呼ばれる巨大IT企業の成長を見れば明らかですが、残念なことに、この中に日本の企業はありません。彼らは、そのコアコンピタンスであるソフトウェア、ハードウェア、Eコマース、SNSなどを基盤に、そこに集まる様々なデータを活用するだけではなく、積極的に自らデータ生成にも取り組んでいます。

しかし、彼らが創業期よりデータをビジネス商材として扱ってきたかというと、決してそうではありません。もっとも創業の新しいFacebookでさえ、すでにスタートから17年の歴史がありますが、彼らはその本業であるビジネスで、着実にそのリーチできる市場やユーザーを増やす過程で生成されるデータを利活用し、さらに新しい取組みへと展開してきました。

ですから、ビッグデータという言葉に踊らされて、今から彼らに比肩するデータを、自ら生成することは、とても現実的な戦略とは言えません。

とはいえ、個々の会社や研究機関、研究者には、それぞれの分野において十分かつ競争力のあるデータが生成され蓄積されています。ここで、データが、他のデータとの組み合わせや、様々な加工をすることにより、新たなデータとなることを考えると、いかに他のデータと掛け合わせるかという部分が競争領域となります。ですから、誰でもが必要データを適切に活用できるためのデータ流通の仕組みを作ることが、日本に新しいビジネスチャンスを生み出すと期待されています。

すなわち、日本の戦略としては、図表3のように、世界レベルで流通・強調する仕組みを推進し、その上で新しい創造的なビジネスで競争することで、これこそがDFFT(Data Free Flow with Trust)という言葉が示していることです。



さて、そこでDSAでは、図表4に示すようにそのビジョンを「World of Data-Driven Innovation:データ利活用によりイノベーションが持続的に起こる世界」としています。このことは、デジタル社会を人間の体に、データを血液に、データ流通を血流とし、血の回りが良くなることで脳が活性化し、よりイノベーティブな活動に人々のリソースが集中できることに例えられると思います。



このようなビジョンとそれを実現するためのミッションを遂行していく上では、様々な分野を超えた連携が必要となることから、図表5に示すDATA-EXという分野間データ連携基盤プラットフォームの構築が進められています。



ここで、注目すべきは、その対象となる分野は、図表5の下段にあるように、あらゆる分野が対象となります。

また、現在日本各地で取り組まれているスマートシティやスーパーシティ、各自治体の整備するデータ連携基盤なども相互に連携していくことになります。

さらには、日本だけでなく世界各国との協調によるデータ連携とそのための標準化という取組みも活発に行われています。

今から四半世紀以上前のインターネット黎明期に、よくインターネットがあらゆる分野をつなぐという図が示されました。これは、それまでの通信が、音声会話のための電話、画像伝送のためのFAX、文字伝送のためのテレタイプなど、アプリケーション別に整備されていたことに対し、インターネットがデジタルパケット通信という汎用性の高い仕組みと自律分散という自由でオープンな取組みの成長性を説明するものでした。そして、今日のインターネットは、まさに当時示されたあらゆる分野の基盤に発展しました。

いま、データ流通は、まさにこのインターネット黎明期と同じで、全ての人が必要なデータを必要なときに使える環境をつくることで、大きな経済効果を生み出すものと期待されているわけです。



4. まとめ



今回は、連載のはじめにあたり、共通となる言葉の意味などについて解説しました。また、日本のビジネスチャンスとして、データ流通の仕組みをつくり、参加者の協調によりイノベーションを起こすことを示しました。次回以降は、より具体的な取組みについて解説したいと思います。


【眞野浩氏の連載概要】
・連載第1回「データ流通とは何か なぜこれが日本のビジネスチャンスになるのか」(アイソス2021年10月号掲載)
・連載第2回「データ流通を取り巻く情報技術と制度(データカタログ、PDS、情報銀行)」(アイソス2021年11月号掲載)
・連載第3回「日本が提案するデータ取引市場の仕組み及び制度(データ取引市場運営事業者)」(アイソス2021年12月号掲載)
・連載第4回「日本発のデータ流通の国際標準P3800の開発経緯」(アイソス2022年1月号掲載)
・連載第5回「P3800の規格内容とデータ流通に与える影響」(アイソス2022年2月号掲載)
・連載第6回・最終回「まとめ:データ流通における今後の課題と展望」(アイソス2022年3月号掲載)




執筆者: 眞野浩

博士(工学)一般社団法人データ社会推進協議会(DSA) 代表理事・事務局長
電子機器メーカー勤務の後、1988年に設計事務所経営を経て、1993年にルート(株)を設立。高速インターネットのインフラを構築する無線IPルータを開発。無線LANを用いた高速移動体通信システムの開発、地域情報化のための各種審議会にも多数参画。2014年シリコンバレーにてEverySense,Inc.を創設、IoT情報流通プラットフォームを開発、現在同社CEO。