2019年に政府が発表したAI戦略において、「文理問わず全ての高等学校卒業生が理数・データサイエンス・AIの基礎的リテラシーを習得」などとあるように、デジタル社会の「読み・書き・そろばん」である「数理・データサイエンス・AI」の基礎習得過程を、学校教育へと取り込む動きが大変活発化しています。実際、2022年の高等学校新学習指導要領においては、共通必修科目「情報Ⅰ」と選択科目「情報Ⅱ」が新設されるなど、データサイエンスの入門的な知識や、実践に必要なプログラミング技術を身につけるための教育環境が整いつつあります。
しかしながら、コンピュータを利用する際に、点字ディスプレイやスクリーンリーダー等の各種支援技術を常用しているような学習者にとって、データサイエンスの習得においては、多くの障壁が想定されます。なぜなら、「大量のデータをグラフとして俯瞰的に分析するような、データサイエンス特有の視覚依存の分析手法」や「発展途上でアクセシビリティが不十分なデータサイエンスの実践環境」など、いまだ問題自体の認識すらあまりされていないような多くの課題が残されているためです。
そこで、データサイエンスの習得に関心を持ちつつも、アクセシビリティの課題によって学ぶことが困難な人々にとって、多少なりとも学ぶ手助けとなるような、ツールや情報等を提供していくことを目的として、本コンテンツを作成しました。
データサイエンスとは、データを用いて新たな知見を引き出そうとするアプローチのことであり、データを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に活用することが求められます。様々なデジタル化の流れに伴い、データサイエンスの重要性は益々高まっており、あらゆる分野の企業や学校において、文系理系を問わず、データサイエンスの知識や技術を学んだり活用したりする機会が増えつつあります。
ここで探索的データ分析とは、データサイエンスで本格的な分析を始める前に、 どのようなデータが与えられているか確認したり、扱いやすいように前処理しておくような処理工程のことであり、 グラフによるデータの可視化などが含まれます。 スクリーンリーダー利用者にとって、データサイエンスを学ぶ上で、最も障壁になるのがこのデータの可視化だったりします。 データの音声化について紹介します。
主にスクリーンリーダーを用いてコンピュータを操作している学生や社会人、そのような生徒達の教育環境に関わる先生方にお読み頂くことを想定しています。 データサイエンスの実践には、Pythonプログラミングを用いますが、初めてプログラミングに触れることも想定して、スクリーンリーダー等の設定などについても丁寧に紹介していきます。 一方で、気軽に取り組み始めて頂くことに重きを置いて、数学やプログラミングについての詳細な説明は省きたいと思います。 たびたび、分からない用語なども出てくるかと思いますが、適宜インターネット等で調べたり、周りの人に質問しながら進めて頂けると幸いです。 知らないことばかりで、慣れないうちは大変かもしれませんが、プログラミングやデータサイエンスではそういった「何でも調べて自己解決しようとする習慣」はとても大事だと思いますので、ぜひ頑張ってみてください。
本コンテンツでは、皆さんがGoogle Colabという開発環境の上で、スクリーンリーダーを使いながら、データサイエンスを色々と自力で試せるようになることを目標としています。 そこに至るまでに提供される知識や技術は、必要最小限のものに過ぎませんが、データサイエンスに関心をもち、探求し続けたいと思う方にとって、貴重な経験ときっかけとなればと考えています。 具体的に次のような流れで構成されています。ボリューム的には、早い人では1日くらいでひと通り学び終えてしまうかもしれない量となっています。
まず第一章では、Google Colab上でプログラミングをするのに必要な、スクリーンリーダーやブラウザの基礎技術について学びます。次に第二章では、現在のデータサイエンスで最も使われているPythonプログラミング言語の基礎について学びます。そして、第三章では、データサイエンスを学ぶ上で欠かせない、データのグラフ表現について、視覚ではなく、音声に頼った手法を紹介します。最後の第四章では、それまでの章で学んできたプログラミング技術やグラフ活用技術を総動員して、入門的なデータサイエンスの実践に取り組みます。