日本語

Course Code etc
Academic Year 2024
College University-wide Liberal Arts Courses (Comprehensive Courses)
Course Code FB105
Theme・Subtitle データサイエンス入門
Class Format Face-to-face (partially online)
Class Format (Supplementary Items) 第2回、第4回、第6回、第8回、第10回、第12回は、オンラインで実施する。
Campus Lecture
Campus Ikebukuro
Semester Fall semester
DayPeriod・Room Thu.2
ログインして教室を表示する(Log in to view the classrooms.)
Credits 2
Course Number CMP2200
Language Japanese
Class Registration Method Exceptional Lottery Registration
Assigned Year 配当年次は開講学部のR Guideに掲載している科目表で確認してください。
Prerequisite Regulations
Acceptance of Other Colleges
Course Cancellation 〇(履修中止可/ Eligible for cancellation)
Online Classes Subject to 60-Credit Upper Limit
Relationship with Degree Policy 各授業科目は、学部・研究科の定める学位授与方針(DP)や教育課程編成の方針(CP)に基づき、カリキュラム上に配置されています。詳細はカリキュラム・マップで確認することができます。
Notes

【Course Objectives】

This lecture will introduce the types and current status of statistical data published by various organizations as a basic knowledge to be able to read and interpret surveys and indicators related to society and the economy.It will also give an overview of various methods of data analysis with the aim of utilizing them to diagnose social and economic conditions.In addition, students will be exposed to methods of collecting and processing primary information such as SNS and media articles as well as existing data, understand how to create data, and practice through exercises.The course also aim to deepen the understanding of data analysis competitions held by companies, etc., and to realize how various data analysis skills are required in practice in modern society.

【Course Contents】

In the class, students will learn how to read and create graphs necessary for analyzing social and economic statistics, how to calculate basic statistics such as simple totals, frequency distributions, and representative values, and how to read data. Students will then learn how to handle applied time-series data, data with trends, and how to calculate and interpret various economic indicators. In the latter half of the course, applied data analysis methods (GIS, text mining, and data analysis competitions) will be introduced, and students will actually perform exercises on simple analyses.
In order to develop practical data analysis skills, this course will consist of one lecture followed by one exercise.

Japanese Items

【授業計画 / Course Schedule】

1 ガイダンス(受講上の注意、社会・経済統計の概念)
2 社会・経済統計へのアクセス(e-stat, RESAS, V-RESASを実例として挙げながら、統計の起源、我が国における統計の政策と現状、データの質、2次データの収集と注意点について学習する)
3 基本統計量に関する演習(e-stat, RESAS, V-RESASを使用し、度数分布、ヒストグラム、箱ひげ図、代表値、分散、散布図、相関、ローレンツ曲線、ジニ係数の算出方法と算出した統計量の読み取り方を学習する。)
4 時系列データ(時間経過に従って変化するようなデータの取り扱いについて学習する。時系列データのグラフの読み取り方、及び作成時の注意点、季節調整、移動平均について算出方法と解釈の仕方を習得する。)
5 時系列データに関する演習(e-stat, RESAS, V-RESASを使用し、季節調整、移動平均について算出方法と解釈の仕方を確認する。)
6 様々な経済指標(e-stat, RESAS, V-RESASを実例として使用しながら、構成比、変化率、寄与度、名目値、実質値について算出方法と解釈の仕方を習得する。)
7 経済指標に関する演習(e-stat, RESAS, V-RESASを使用し、構成比、変化率、寄与度、名目値、実質値について算出方法と解釈の仕方を確認する。)
8 地理情報を持つ統計情報から社会・経済を診断する(位置情報を持つデータを取り扱う際に必要になってくる地理情報システムやよく使われるwebGISやデスクトップGISの紹介。実例を用いながら、座標系、投影法について体系的に学習する)
9 GISに関する演習(地理院地図、RESAS, V-RESASを使用し、コロプレスマップ、ヒートマップなどを作成する。)
10 文章から社会・経済を診断する(テキストマイニングの方法について学習する。各種形態素解析器の紹介、Zipfの法則、タイプ、トークン比、TF-IDFなど基礎知識の習得を目指す。)
11 テキストマニングに関する演習(1次情報の取得の方法と注意点、加工の仕方について学習する。形態素解析を行なったテキストについてクロス集計、統計的検定を行う。)
12 総合的な分析(社会で開催されている様々なデータ分析コンペティションについて概観する、各コンペティションの規模、種類、対象について整理する。)
13 総合的な分析に関する実習(現在、世界最大規模のデータ分析コンペティションであるkaggleを実際に使用しつつ、実社会におけるデータ分析の必要性や範囲、様々な手法が実用されていることを実感する。)
14 まとめ(最終テスト)

【活用される授業方法 / Teaching Methods Used】

板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above

【授業時間外(予習・復習等)の学修 / Study Required Outside of Class】

・レジュメや関連資料を再読し,不明な点がないか確認すること。
・指標や図表の作成手順を理解し、自分で再現できるか確認する。
・統計を通じて社会を観察し、自らの考えや論点を明確にし、それを学術的な文章として簡潔にまとめる。
・講義1回あたりにかかる準備及び課題にかかる時間は各回合計240分以上を想定。
・各演習回で使用するデータやソフトウェアについて予め調べ、自分のPCにインストールできるものは各自でインストールし、動作確認すること。講義内では動作確認が済んでいることを前提に、課題やディスカッションを進める。

【成績評価方法・基準 / Evaluation】

種類 (Kind)割合 (%)基準 (Criteria)
平常点 (In-class Points)100 授業課題(6回×10%, 記述課題含む)(60%)
最終テスト(Final Test)(40%)
備考 (Notes)

【テキスト / Textbooks】

その他 (Others)
適宜、資料を配布する。

【参考文献 / Readings】

No著者名 (Author/Editor)書籍名 (Title)出版社 (Publisher)出版年 (Date)ISBN/ISSN
1 立教大学社会情報教育研究センター 『日本の公的統計・統計調査』 三恵社 2019 9784866931258
その他 (Others)
その他、講義に必要と考えられる文献を各自調べておくこと。
・参考文献『日本の公的統計・統計調査』については、立教大学の学生には CSI 事務室にて、無料で配布している(参考 URL:https://spirit.rikkyo.ac.jp/csi/toukei/SitePages/measure.aspx)。

【履修にあたって求められる能力 / Abilities Required to Take the Course】

基本的な統計知識(平均、分散、標準偏差、度数分布表、ヒストグラム、散布図、相関など)があることが望ましい。

【学生が準備すべき機器等 / Equipment, etc., that Students Should Prepare】

PCを使って演習を行う。

【その他 / Others】

・e-stat「政府統計の総合窓口」、RESAS「地域経済分析システム」、V-RESASの情報を利用する。
・国土地理院 地理院地図(GIS Maps)を利用する。
・kaggle(https://www.kaggle.com/)を利用する。予めアカウントを作成のこと。

【注意事項 / Notice】

2016年度以降入学者:多彩な学び
2015年度以前入学者:主題別A