日本語 English
開講年度/ Academic YearAcademic Year |
20242024 |
科目設置学部/ CollegeCollege |
全学共通科目・全学共通カリキュラム(総合系)/University-wide Liberal Arts Courses (Comprehensive Courses)University-wide Liberal Arts Courses (Comprehensive Courses) |
科目コード等/ Course CodeCourse Code |
FB105/FB105FB105 |
テーマ・サブタイトル等/ Theme・SubtitleTheme・Subtitle |
データサイエンス入門 |
授業形態/ Class FormatClass Format |
対面(一部オンライン)/Face-to-face (partially online)Face-to-face (partially online) |
授業形態(補足事項)/ Class Format (Supplementary Items)Class Format (Supplementary Items) |
第2回、第4回、第6回、第8回、第10回、第12回は、オンラインで実施する。 |
授業形式/ Class StyleCampus |
講義/LectureLecture |
校地/ CampusCampus |
池袋/IkebukuroIkebukuro |
学期/ SemesterSemester |
秋学期/Fall semesterFall semester |
曜日時限・教室/ DayPeriod・RoomDayPeriod・Room |
木2/Thu.2 Thu.2 ログインして教室を表示する(Log in to view the classrooms.) |
単位/ CreditsCredits |
22 |
科目ナンバリング/ Course NumberCourse Number |
CMP2200 |
使用言語/ LanguageLanguage |
日本語/JapaneseJapanese |
履修登録方法/ Class Registration MethodClass Registration Method |
抽選他/Exceptional Lottery RegistrationExceptional Lottery Registration |
配当年次/ Assigned YearAssigned Year |
配当年次は開講学部のR Guideに掲載している科目表で確認してください。配当年次は開講学部のR Guideに掲載している科目表で確認してください。 |
先修規定/ Prerequisite RegulationsPrerequisite Regulations |
|
他学部履修可否/ Acceptance of Other CollegesAcceptance of Other Colleges |
|
履修中止可否/ Course CancellationCourse Cancellation |
〇(履修中止可/ Eligible for cancellation) |
オンライン授業60単位制限対象科目/ Online Classes Subject to 60-Credit Upper LimitOnline Classes Subject to 60-Credit Upper Limit |
|
学位授与方針との関連/ Relationship with Degree PolicyRelationship with Degree Policy |
各授業科目は、学部・研究科の定める学位授与方針(DP)や教育課程編成の方針(CP)に基づき、カリキュラム上に配置されています。詳細はカリキュラム・マップで確認することができます。 |
備考/ NotesNotes |
This lecture will introduce the types and current status of statistical data published by various organizations as a basic knowledge to be able to read and interpret surveys and indicators related to society and the economy.It will also give an overview of various methods of data analysis with the aim of utilizing them to diagnose social and economic conditions.In addition, students will be exposed to methods of collecting and processing primary information such as SNS and media articles as well as existing data, understand how to create data, and practice through exercises.The course also aim to deepen the understanding of data analysis competitions held by companies, etc., and to realize how various data analysis skills are required in practice in modern society.
In the class, students will learn how to read and create graphs necessary for analyzing social and economic statistics, how to calculate basic statistics such as simple totals, frequency distributions, and representative values, and how to read data. Students will then learn how to handle applied time-series data, data with trends, and how to calculate and interpret various economic indicators. In the latter half of the course, applied data analysis methods (GIS, text mining, and data analysis competitions) will be introduced, and students will actually perform exercises on simple analyses.
In order to develop practical data analysis skills, this course will consist of one lecture followed by one exercise.
1 | ガイダンス(受講上の注意、社会・経済統計の概念) |
2 | 社会・経済統計へのアクセス(e-stat, RESAS, V-RESASを実例として挙げながら、統計の起源、我が国における統計の政策と現状、データの質、2次データの収集と注意点について学習する) |
3 | 基本統計量に関する演習(e-stat, RESAS, V-RESASを使用し、度数分布、ヒストグラム、箱ひげ図、代表値、分散、散布図、相関、ローレンツ曲線、ジニ係数の算出方法と算出した統計量の読み取り方を学習する。) |
4 | 時系列データ(時間経過に従って変化するようなデータの取り扱いについて学習する。時系列データのグラフの読み取り方、及び作成時の注意点、季節調整、移動平均について算出方法と解釈の仕方を習得する。) |
5 | 時系列データに関する演習(e-stat, RESAS, V-RESASを使用し、季節調整、移動平均について算出方法と解釈の仕方を確認する。) |
6 | 様々な経済指標(e-stat, RESAS, V-RESASを実例として使用しながら、構成比、変化率、寄与度、名目値、実質値について算出方法と解釈の仕方を習得する。) |
7 | 経済指標に関する演習(e-stat, RESAS, V-RESASを使用し、構成比、変化率、寄与度、名目値、実質値について算出方法と解釈の仕方を確認する。) |
8 | 地理情報を持つ統計情報から社会・経済を診断する(位置情報を持つデータを取り扱う際に必要になってくる地理情報システムやよく使われるwebGISやデスクトップGISの紹介。実例を用いながら、座標系、投影法について体系的に学習する) |
9 | GISに関する演習(地理院地図、RESAS, V-RESASを使用し、コロプレスマップ、ヒートマップなどを作成する。) |
10 | 文章から社会・経済を診断する(テキストマイニングの方法について学習する。各種形態素解析器の紹介、Zipfの法則、タイプ、トークン比、TF-IDFなど基礎知識の習得を目指す。) |
11 | テキストマニングに関する演習(1次情報の取得の方法と注意点、加工の仕方について学習する。形態素解析を行なったテキストについてクロス集計、統計的検定を行う。) |
12 | 総合的な分析(社会で開催されている様々なデータ分析コンペティションについて概観する、各コンペティションの規模、種類、対象について整理する。) |
13 | 総合的な分析に関する実習(現在、世界最大規模のデータ分析コンペティションであるkaggleを実際に使用しつつ、実社会におけるデータ分析の必要性や範囲、様々な手法が実用されていることを実感する。) |
14 | まとめ(最終テスト) |
板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above
・レジュメや関連資料を再読し,不明な点がないか確認すること。
・指標や図表の作成手順を理解し、自分で再現できるか確認する。
・統計を通じて社会を観察し、自らの考えや論点を明確にし、それを学術的な文章として簡潔にまとめる。
・講義1回あたりにかかる準備及び課題にかかる時間は各回合計240分以上を想定。
・各演習回で使用するデータやソフトウェアについて予め調べ、自分のPCにインストールできるものは各自でインストールし、動作確認すること。講義内では動作確認が済んでいることを前提に、課題やディスカッションを進める。
種類 (Kind) | 割合 (%) | 基準 (Criteria) |
---|---|---|
平常点 (In-class Points) | 100 |
授業課題(6回×10%, 記述課題含む)(60%) 最終テスト(Final Test)(40%) |
備考 (Notes) | ||
その他 (Others) | |||||
---|---|---|---|---|---|
適宜、資料を配布する。 |
No | 著者名 (Author/Editor) | 書籍名 (Title) | 出版社 (Publisher) | 出版年 (Date) | ISBN/ISSN |
---|---|---|---|---|---|
1 | 立教大学社会情報教育研究センター | 『日本の公的統計・統計調査』 | 三恵社 | 2019 | 9784866931258 |
その他 (Others) | |||||
その他、講義に必要と考えられる文献を各自調べておくこと。 ・参考文献『日本の公的統計・統計調査』については、立教大学の学生には CSI 事務室にて、無料で配布している(参考 URL:https://spirit.rikkyo.ac.jp/csi/toukei/SitePages/measure.aspx)。 |
基本的な統計知識(平均、分散、標準偏差、度数分布表、ヒストグラム、散布図、相関など)があることが望ましい。
PCを使って演習を行う。
・e-stat「政府統計の総合窓口」、RESAS「地域経済分析システム」、V-RESASの情報を利用する。
・国土地理院 地理院地図(GIS Maps)を利用する。
・kaggle(https://www.kaggle.com/)を利用する。予めアカウントを作成のこと。
2016年度以降入学者:多彩な学び
2015年度以前入学者:主題別A
本講義では、社会や経済に関する調査や指標を読み解けるようになるための基礎知識として、様々な機関が公表している統計データの種類や現状を紹介する。また、それらを活用して、社会的・経済を診断するという目的に沿って、様々なデータ解析の方法を概観する。さらに、既存のデータだけでなく、SNSやメディア記事など1次情報の収集、加工の方法に触れ、データの作成方法についても理解し、演習を通して実践する。また、企業等が開催するデータ分析コンペティションへの理解を深め、現代社会においていかに実践の場で各種のデータ分析スキルが求められているかを実感することを目的とする。
This lecture will introduce the types and current status of statistical data published by various organizations as a basic knowledge to be able to read and interpret surveys and indicators related to society and the economy.It will also give an overview of various methods of data analysis with the aim of utilizing them to diagnose social and economic conditions.In addition, students will be exposed to methods of collecting and processing primary information such as SNS and media articles as well as existing data, understand how to create data, and practice through exercises.The course also aim to deepen the understanding of data analysis competitions held by companies, etc., and to realize how various data analysis skills are required in practice in modern society.
授業では社会、経済統計を分析するために必要なグラフの読み方や作成方法、単純集計、度数分布、代表値などの基本的な統計量の算出方法、データの読み取り方を学習する。その後、応用的な時系列データの取り扱いやトレンドのあるデータ、各種の経済指標の算出方法と解釈の仕方を学習する。後半回では、応用的なデータ分析の方法(GIS、テキストマイニング、データ分析コンペティション)を紹介し、実際に簡単な分析についての演習を行う。
本講義では実践的なデータ分析のスキルを養うため、1回の講義の後、1回の演習を行う。
In the class, students will learn how to read and create graphs necessary for analyzing social and economic statistics, how to calculate basic statistics such as simple totals, frequency distributions, and representative values, and how to read data. Students will then learn how to handle applied time-series data, data with trends, and how to calculate and interpret various economic indicators. In the latter half of the course, applied data analysis methods (GIS, text mining, and data analysis competitions) will be introduced, and students will actually perform exercises on simple analyses.
In order to develop practical data analysis skills, this course will consist of one lecture followed by one exercise.
1 | ガイダンス(受講上の注意、社会・経済統計の概念) |
2 | 社会・経済統計へのアクセス(e-stat, RESAS, V-RESASを実例として挙げながら、統計の起源、我が国における統計の政策と現状、データの質、2次データの収集と注意点について学習する) |
3 | 基本統計量に関する演習(e-stat, RESAS, V-RESASを使用し、度数分布、ヒストグラム、箱ひげ図、代表値、分散、散布図、相関、ローレンツ曲線、ジニ係数の算出方法と算出した統計量の読み取り方を学習する。) |
4 | 時系列データ(時間経過に従って変化するようなデータの取り扱いについて学習する。時系列データのグラフの読み取り方、及び作成時の注意点、季節調整、移動平均について算出方法と解釈の仕方を習得する。) |
5 | 時系列データに関する演習(e-stat, RESAS, V-RESASを使用し、季節調整、移動平均について算出方法と解釈の仕方を確認する。) |
6 | 様々な経済指標(e-stat, RESAS, V-RESASを実例として使用しながら、構成比、変化率、寄与度、名目値、実質値について算出方法と解釈の仕方を習得する。) |
7 | 経済指標に関する演習(e-stat, RESAS, V-RESASを使用し、構成比、変化率、寄与度、名目値、実質値について算出方法と解釈の仕方を確認する。) |
8 | 地理情報を持つ統計情報から社会・経済を診断する(位置情報を持つデータを取り扱う際に必要になってくる地理情報システムやよく使われるwebGISやデスクトップGISの紹介。実例を用いながら、座標系、投影法について体系的に学習する) |
9 | GISに関する演習(地理院地図、RESAS, V-RESASを使用し、コロプレスマップ、ヒートマップなどを作成する。) |
10 | 文章から社会・経済を診断する(テキストマイニングの方法について学習する。各種形態素解析器の紹介、Zipfの法則、タイプ、トークン比、TF-IDFなど基礎知識の習得を目指す。) |
11 | テキストマニングに関する演習(1次情報の取得の方法と注意点、加工の仕方について学習する。形態素解析を行なったテキストについてクロス集計、統計的検定を行う。) |
12 | 総合的な分析(社会で開催されている様々なデータ分析コンペティションについて概観する、各コンペティションの規模、種類、対象について整理する。) |
13 | 総合的な分析に関する実習(現在、世界最大規模のデータ分析コンペティションであるkaggleを実際に使用しつつ、実社会におけるデータ分析の必要性や範囲、様々な手法が実用されていることを実感する。) |
14 | まとめ(最終テスト) |
板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above
・レジュメや関連資料を再読し,不明な点がないか確認すること。
・指標や図表の作成手順を理解し、自分で再現できるか確認する。
・統計を通じて社会を観察し、自らの考えや論点を明確にし、それを学術的な文章として簡潔にまとめる。
・講義1回あたりにかかる準備及び課題にかかる時間は各回合計240分以上を想定。
・各演習回で使用するデータやソフトウェアについて予め調べ、自分のPCにインストールできるものは各自でインストールし、動作確認すること。講義内では動作確認が済んでいることを前提に、課題やディスカッションを進める。
種類 (Kind) | 割合 (%) | 基準 (Criteria) |
---|---|---|
平常点 (In-class Points) | 100 |
授業課題(6回×10%, 記述課題含む)(60%) 最終テスト(Final Test)(40%) |
備考 (Notes) | ||
その他 (Others) | |||||
---|---|---|---|---|---|
適宜、資料を配布する。 |
No | 著者名 (Author/Editor) | 書籍名 (Title) | 出版社 (Publisher) | 出版年 (Date) | ISBN/ISSN |
---|---|---|---|---|---|
1 | 立教大学社会情報教育研究センター | 『日本の公的統計・統計調査』 | 三恵社 | 2019 | 9784866931258 |
その他 (Others) | |||||
その他、講義に必要と考えられる文献を各自調べておくこと。 ・参考文献『日本の公的統計・統計調査』については、立教大学の学生には CSI 事務室にて、無料で配布している(参考 URL:https://spirit.rikkyo.ac.jp/csi/toukei/SitePages/measure.aspx)。 |
基本的な統計知識(平均、分散、標準偏差、度数分布表、ヒストグラム、散布図、相関など)があることが望ましい。
PCを使って演習を行う。
・e-stat「政府統計の総合窓口」、RESAS「地域経済分析システム」、V-RESASの情報を利用する。
・国土地理院 地理院地図(GIS Maps)を利用する。
・kaggle(https://www.kaggle.com/)を利用する。予めアカウントを作成のこと。
2016年度以降入学者:多彩な学び
2015年度以前入学者:主題別A