日本語 English
| 開講年度/ Academic YearAcademic Year |
20262026 |
| 科目設置学部/ CollegeCollege |
社会学部/College of SociologyCollege of Sociology |
| 科目コード等/ Course CodeCourse Code |
DE408/DE408DE408 |
| テーマ・サブタイトル等/ Theme・SubtitleTheme・Subtitle |
メディア芸術データベースで学ぶデータサイエンス入門 |
| 授業形態/ Class FormatClass Format |
対面(全回対面)/Face to face (all classes are face-to-face)Face to face (all classes are face-to-face) |
| 授業形態(補足事項)/ Class Format (Supplementary Items)Class Format (Supplementary Items) |
|
| 授業形式/ Class StyleCampus |
講義/LectureLecture |
| 校地/ CampusCampus |
池袋/IkebukuroIkebukuro |
| 学期/ SemesterSemester |
春学期/Spring SemesterSpring Semester |
| 曜日時限・教室/ DayPeriod・RoomDayPeriod・Room |
水2/Wed.2 Wed.2 ログインして教室を表示する(Log in to view the classrooms.) |
| 単位/ CreditsCredits |
22 |
| 科目ナンバリング/ Course NumberCourse Number |
CMS3410 |
| 使用言語/ LanguageLanguage |
日本語/JapaneseJapanese |
| 履修登録方法/ Class Registration MethodClass Registration Method |
科目コード登録/Course Code RegistrationCourse Code Registration |
| 配当年次/ Assigned YearAssigned Year |
配当年次は開講学部のR Guideに掲載している科目表で確認してください。配当年次は開講学部のR Guideに掲載している科目表で確認してください。 |
| 先修規定/ Prerequisite RegulationsPrerequisite Regulations |
|
| 他学部履修可否/ Acceptance of Other CollegesAcceptance of Other Colleges |
履修登録システムの『他学部・他研究科履修不許可科目一覧』で確認してください。 |
| 履修中止可否/ Course CancellationCourse Cancellation |
〇(履修中止可/ Eligible for cancellation) |
| オンライン授業60単位制限対象科目/ Online Classes Subject to 60-Credit Upper LimitOnline Classes Subject to 60-Credit Upper Limit |
|
| 学位授与方針との関連/ Relationship with Degree PolicyRelationship with Degree Policy |
各授業科目は、学部・研究科の定める学位授与方針(DP)や教育課程編成の方針(CP)に基づき、カリキュラム上に配置されています。詳細はカリキュラム・マップで確認することができます。 https://www.rikkyo.ac.jp/about/disclosure/educational_policy/sociology.html |
| 備考/ NotesNotes |
The objective of this course is to enable beginners in data science to develop a quantitative, data-driven perspective for analyzing media, and to systematically acquire data manipulation skills applicable to both academic research and professional practice.
In real-world data analysis, so-called “preprocessing” tasks—such as data creation, transformation, and cleaning—are processes that are as important as, or even more important than, the analysis itself.
With this perspective in mind, the course emphasizes not only an understanding of analytical methods, but also practical learning of the processes leading up to analysis.
Specifically, students will aim to acquire techniques for efficiently manipulating large-scale datasets consisting of several million rows through programming—tasks that are difficult to handle using spreadsheet software such as Excel.
As hands-on exercise material, the course uses a manga metadata dataset from the “Media Arts Database,” and sets the following learning objectives:
Data Import: Students will be able to load data using Python and format it into a form suitable for analysis.
Data Cleaning: Students will be able to identify and preprocess issues such as missing values, data types (strings and dates), duplicates, and inconsistencies in notation based on defined rules.
Descriptive Statistics and Basic Aggregation: Students will be able to explain the characteristics of data using basic descriptive statistics such as counts, proportions, and measures of central tendency.
Visualization: Students will be able to select appropriate visualizations—such as bar charts, line graphs, and histograms—according to purpose, and create figures that effectively communicate information to the reader.
Cross Tabulation: Students will be able to construct cross tables showing the relationship between two categorical variables using counts and composition ratios (row percentages and column percentages), and interpret the results.
The primary aim of this course is to acquire data science and programming skills for the study of media. While manga metadata are used as the object of analysis, students should note that this course does not involve viewing or reading manga works themselves.
Using manga metadata, this course focuses on hands-on learning to guide students through the complete workflow of data analysis using Python in each session.
The course is structured in stages, covering: (1) data acquisition and loading, (2) data formatting and cleaning, (3) descriptive statistics and visualization, (4) comparative analysis using cross tabulation, and (5) methods for summarizing results, with attention to reproducibility and explanation.
Each class proceeds in the sequence of “lecture → exercises → assignments,” and culminates in a mini-project in which students formulate their own research questions and submit and present their analytical results.
In working with data, the course also addresses important considerations related to secondary data use, including proper citation of data sources.
| 1 | ガイダンス |
| 2 | Pythonプログラミングの導入 Google Colaboratoryの使い方 |
| 3 | データ取得と読み込み JSON、CSV、パスの理解 |
| 4 | DataFrame操作 タイトル、作者、出版社、発行日の表作成 |
| 5 | データクリーニング① 出版社、著者名の表記揺れのチェック |
| 6 | データクリーニング② 日付・欠損・重複 |
| 7 | 基礎集計:ランキング作成 出版社別・著者別の作品数カウント |
| 8 | 記述統計:データの要約 データの分布と「平均的なマンガ」の姿 |
| 9 | データの可視化(グラフ作成) マンガ出版点数の時系列推移(折れ線グラフ) |
| 10 | クロス表 「出版社×年代」で見る出版傾向の変遷 |
| 11 | 探索的データ解析 散布図、ヒストグラム、外れ値 |
| 12 | まとめ |
| 13 | 発表① |
| 14 | 発表② |
板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above
授業で扱うPythonのプログラミングについて、自力で再現できるように復習してください。
データ分析の結果を正しく読み解くため、対象となるマンガ業界の動向や各出版社の特徴について、自主的に調査を行い背景知識を深めるとともに、ご自身が分析したい作者・タイトル・出版社などを見つけてください。
| 種類 (Kind) | 割合 (%) | 基準 (Criteria) |
|---|---|---|
| 平常点 (In-class Points) | 100 |
授業内で指示する課題(30%) 発表(30%) レポート(40%) |
| 備考 (Notes) | ||
なし/None
マンガに関するメタデータを用いる予定のため、マンガに触れた経験を有することが望ましいです。
データサイエンス未経験者を対象とするため、統計の知識やプログラミング経験は問いませんが、新しい知識・スキルを習得しようとする意欲・積極性が求められます。
・PC
・Pythonの実行環境を持っていない学生は、Google Colaboratoryを利用するため、Googleアカウントを取得してください
発表形式および授業の構成については、受講者数に応じて調整します。
本授業の目的は、データサイエンス初学者が、メディアをデータに基づいて定量的に分析する視点を養い、研究や実務の現場で通用するデータ操作スキルを体系的に身につけることです。
データ分析の現場において、データの作成・加工・クリーニングといった「前処理」は、分析そのものと同等以上に重要な工程です。
本授業ではこの点に着目し、分析手法の理解だけでなく、分析に至るまでのプロセスを実践的に学ぶことを重視します。
具体的には、Excel等の表計算ソフトでは処理困難な数百万行規模のデータを、プログラミングによって効率的に操作する技術の習得を目指します。
演習の題材として「メディア芸術データベース」のマンガのメタデータセットを用い、以下の到達目標を設定します。
データの読み込み:データをPythonで読み込み、分析可能な形式へ整形できる。
データクリーニング:欠損、型(文字列・日付)、重複、表記ゆれなどを発見し、ルールに基づいて前処理できる。
記述統計と基本集計:件数・割合・代表値などの基本的な記述統計を用いて、データの特徴を説明できる。
可視化:棒グラフ・折れ線・ヒストグラム等を目的に応じて選択し、読み手に伝わる図として作成できる。
クロス表:2つのカテゴリの関係を、件数・構成比(行%/列%)のクロス表で作成し、読み取り・解釈できる。
本授業は、メディアを研究するためのデータサイエンスおよびプログラミングスキルの習得を主目的としています。分析対象としてマンガのメタデータを扱いますが、マンガ作品そのものの閲覧・読解は行いませんのでご注意ください。
The objective of this course is to enable beginners in data science to develop a quantitative, data-driven perspective for analyzing media, and to systematically acquire data manipulation skills applicable to both academic research and professional practice.
In real-world data analysis, so-called “preprocessing” tasks—such as data creation, transformation, and cleaning—are processes that are as important as, or even more important than, the analysis itself.
With this perspective in mind, the course emphasizes not only an understanding of analytical methods, but also practical learning of the processes leading up to analysis.
Specifically, students will aim to acquire techniques for efficiently manipulating large-scale datasets consisting of several million rows through programming—tasks that are difficult to handle using spreadsheet software such as Excel.
As hands-on exercise material, the course uses a manga metadata dataset from the “Media Arts Database,” and sets the following learning objectives:
Data Import: Students will be able to load data using Python and format it into a form suitable for analysis.
Data Cleaning: Students will be able to identify and preprocess issues such as missing values, data types (strings and dates), duplicates, and inconsistencies in notation based on defined rules.
Descriptive Statistics and Basic Aggregation: Students will be able to explain the characteristics of data using basic descriptive statistics such as counts, proportions, and measures of central tendency.
Visualization: Students will be able to select appropriate visualizations—such as bar charts, line graphs, and histograms—according to purpose, and create figures that effectively communicate information to the reader.
Cross Tabulation: Students will be able to construct cross tables showing the relationship between two categorical variables using counts and composition ratios (row percentages and column percentages), and interpret the results.
The primary aim of this course is to acquire data science and programming skills for the study of media. While manga metadata are used as the object of analysis, students should note that this course does not involve viewing or reading manga works themselves.
マンガのメタデータを用い、Pythonによるデータ分析の一連の流れを、毎回のハンズオンを中心に学びます。
授業では、①データの入手と読み込み、②整形・クリーニング、③記述統計と可視化、④クロス表による比較分析、⑤結果のまとめ方(再現性・説明)を段階的に扱います。
授業は「講義→演習→課題」で進め、最終的にミニプロジェクトとして各自が問いを立て、分析結果を提出・発表します。
データ利用にあたっては、出典の明記など、二次利用上の注意点も確認しながら進めます。
Using manga metadata, this course focuses on hands-on learning to guide students through the complete workflow of data analysis using Python in each session.
The course is structured in stages, covering: (1) data acquisition and loading, (2) data formatting and cleaning, (3) descriptive statistics and visualization, (4) comparative analysis using cross tabulation, and (5) methods for summarizing results, with attention to reproducibility and explanation.
Each class proceeds in the sequence of “lecture → exercises → assignments,” and culminates in a mini-project in which students formulate their own research questions and submit and present their analytical results.
In working with data, the course also addresses important considerations related to secondary data use, including proper citation of data sources.
| 1 | ガイダンス |
| 2 | Pythonプログラミングの導入 Google Colaboratoryの使い方 |
| 3 | データ取得と読み込み JSON、CSV、パスの理解 |
| 4 | DataFrame操作 タイトル、作者、出版社、発行日の表作成 |
| 5 | データクリーニング① 出版社、著者名の表記揺れのチェック |
| 6 | データクリーニング② 日付・欠損・重複 |
| 7 | 基礎集計:ランキング作成 出版社別・著者別の作品数カウント |
| 8 | 記述統計:データの要約 データの分布と「平均的なマンガ」の姿 |
| 9 | データの可視化(グラフ作成) マンガ出版点数の時系列推移(折れ線グラフ) |
| 10 | クロス表 「出版社×年代」で見る出版傾向の変遷 |
| 11 | 探索的データ解析 散布図、ヒストグラム、外れ値 |
| 12 | まとめ |
| 13 | 発表① |
| 14 | 発表② |
板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above
授業で扱うPythonのプログラミングについて、自力で再現できるように復習してください。
データ分析の結果を正しく読み解くため、対象となるマンガ業界の動向や各出版社の特徴について、自主的に調査を行い背景知識を深めるとともに、ご自身が分析したい作者・タイトル・出版社などを見つけてください。
| 種類 (Kind) | 割合 (%) | 基準 (Criteria) |
|---|---|---|
| 平常点 (In-class Points) | 100 |
授業内で指示する課題(30%) 発表(30%) レポート(40%) |
| 備考 (Notes) | ||
なし/None
マンガに関するメタデータを用いる予定のため、マンガに触れた経験を有することが望ましいです。
データサイエンス未経験者を対象とするため、統計の知識やプログラミング経験は問いませんが、新しい知識・スキルを習得しようとする意欲・積極性が求められます。
・PC
・Pythonの実行環境を持っていない学生は、Google Colaboratoryを利用するため、Googleアカウントを取得してください
発表形式および授業の構成については、受講者数に応じて調整します。