日本語

Course Code etc
Academic Year 2026
College College of Sociology
Course Code DE408
Theme・Subtitle メディア芸術データベースで学ぶデータサイエンス入門
Class Format Face to face (all classes are face-to-face)
Class Format (Supplementary Items)
Campus Lecture
Campus Ikebukuro
Semester Spring Semester
DayPeriod・Room Wed.2
ログインして教室を表示する(Log in to view the classrooms.)
Credits 2
Course Number CMS3410
Language Japanese
Class Registration Method Course Code Registration
Assigned Year 配当年次は開講学部のR Guideに掲載している科目表で確認してください。
Prerequisite Regulations
Acceptance of Other Colleges 履修登録システムの『他学部・他研究科履修不許可科目一覧』で確認してください。
Course Cancellation 〇(履修中止可/ Eligible for cancellation)
Online Classes Subject to 60-Credit Upper Limit
Relationship with Degree Policy 各授業科目は、学部・研究科の定める学位授与方針(DP)や教育課程編成の方針(CP)に基づき、カリキュラム上に配置されています。詳細はカリキュラム・マップで確認することができます。
https://www.rikkyo.ac.jp/about/disclosure/educational_policy/sociology.html
Notes

【Course Objectives】

The objective of this course is to enable beginners in data science to develop a quantitative, data-driven perspective for analyzing media, and to systematically acquire data manipulation skills applicable to both academic research and professional practice.
In real-world data analysis, so-called “preprocessing” tasks—such as data creation, transformation, and cleaning—are processes that are as important as, or even more important than, the analysis itself.
With this perspective in mind, the course emphasizes not only an understanding of analytical methods, but also practical learning of the processes leading up to analysis.
Specifically, students will aim to acquire techniques for efficiently manipulating large-scale datasets consisting of several million rows through programming—tasks that are difficult to handle using spreadsheet software such as Excel.
As hands-on exercise material, the course uses a manga metadata dataset from the “Media Arts Database,” and sets the following learning objectives:

Data Import: Students will be able to load data using Python and format it into a form suitable for analysis.
Data Cleaning: Students will be able to identify and preprocess issues such as missing values, data types (strings and dates), duplicates, and inconsistencies in notation based on defined rules.
Descriptive Statistics and Basic Aggregation: Students will be able to explain the characteristics of data using basic descriptive statistics such as counts, proportions, and measures of central tendency.
Visualization: Students will be able to select appropriate visualizations—such as bar charts, line graphs, and histograms—according to purpose, and create figures that effectively communicate information to the reader.
Cross Tabulation: Students will be able to construct cross tables showing the relationship between two categorical variables using counts and composition ratios (row percentages and column percentages), and interpret the results.

The primary aim of this course is to acquire data science and programming skills for the study of media. While manga metadata are used as the object of analysis, students should note that this course does not involve viewing or reading manga works themselves.

【Course Contents】

Using manga metadata, this course focuses on hands-on learning to guide students through the complete workflow of data analysis using Python in each session.
The course is structured in stages, covering: (1) data acquisition and loading, (2) data formatting and cleaning, (3) descriptive statistics and visualization, (4) comparative analysis using cross tabulation, and (5) methods for summarizing results, with attention to reproducibility and explanation.
Each class proceeds in the sequence of “lecture → exercises → assignments,” and culminates in a mini-project in which students formulate their own research questions and submit and present their analytical results.
In working with data, the course also addresses important considerations related to secondary data use, including proper citation of data sources.

Japanese Items

【授業計画 / Course Schedule】

1 ガイダンス
2 Pythonプログラミングの導入
Google Colaboratoryの使い方
3 データ取得と読み込み
JSON、CSV、パスの理解
4 DataFrame操作
タイトル、作者、出版社、発行日の表作成
5 データクリーニング①
出版社、著者名の表記揺れのチェック
6 データクリーニング②
日付・欠損・重複
7 基礎集計:ランキング作成
出版社別・著者別の作品数カウント
8 記述統計:データの要約
データの分布と「平均的なマンガ」の姿
9 データの可視化(グラフ作成)
マンガ出版点数の時系列推移(折れ線グラフ)
10 クロス表
「出版社×年代」で見る出版傾向の変遷
11 探索的データ解析
散布図、ヒストグラム、外れ値
12 まとめ
13 発表①
14 発表②

【活用される授業方法 / Teaching Methods Used】

板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above

【授業時間外(予習・復習等)の学修 / Study Required Outside of Class】

授業で扱うPythonのプログラミングについて、自力で再現できるように復習してください。
データ分析の結果を正しく読み解くため、対象となるマンガ業界の動向や各出版社の特徴について、自主的に調査を行い背景知識を深めるとともに、ご自身が分析したい作者・タイトル・出版社などを見つけてください。

【成績評価方法・基準 / Evaluation】

種類 (Kind)割合 (%)基準 (Criteria)
平常点 (In-class Points)100 授業内で指示する課題(30%)
発表(30%)
レポート(40%)
備考 (Notes)

【テキスト / Textbooks】

なし/None

【参考文献 / Readings】

【履修にあたって求められる能力 / Abilities Required to Take the Course】

マンガに関するメタデータを用いる予定のため、マンガに触れた経験を有することが望ましいです。
データサイエンス未経験者を対象とするため、統計の知識やプログラミング経験は問いませんが、新しい知識・スキルを習得しようとする意欲・積極性が求められます。

【学生が準備すべき機器等 / Equipment, etc., that Students Should Prepare】

・PC
・Pythonの実行環境を持っていない学生は、Google Colaboratoryを利用するため、Googleアカウントを取得してください

【その他 / Others】

発表形式および授業の構成については、受講者数に応じて調整します。

【注意事項 / Notice】