日本語 English
| 開講年度/ Academic YearAcademic Year |
20262026 |
| 科目設置学部/ CollegeCollege |
文学部/College of ArtsCollege of Arts |
| 科目コード等/ Course CodeCourse Code |
AL237/AL237AL237 |
| テーマ・サブタイトル等/ Theme・SubtitleTheme・Subtitle |
|
| 授業形態/ Class FormatClass Format |
対面(一部オンライン)/Face-to-face (partially online)Face-to-face (partially online) |
| 授業形態(補足事項)/ Class Format (Supplementary Items)Class Format (Supplementary Items) |
オンライン回:第7,8,11,12,13回目(予定) |
| 授業形式/ Class StyleCampus |
講義/LectureLecture |
| 校地/ CampusCampus |
池袋/IkebukuroIkebukuro |
| 学期/ SemesterSemester |
春学期/Spring SemesterSpring Semester |
| 曜日時限・教室/ DayPeriod・RoomDayPeriod・Room |
水2/Wed.2 Wed.2 ログインして教室を表示する(Log in to view the classrooms.) |
| 単位/ CreditsCredits |
22 |
| 科目ナンバリング/ Course NumberCourse Number |
ART1400 |
| 使用言語/ LanguageLanguage |
日本語/JapaneseJapanese |
| 履修登録方法/ Class Registration MethodClass Registration Method |
抽選登録/Lottery RegistrationLottery Registration(定員:200人/ Capacity:200) |
| 配当年次/ Assigned YearAssigned Year |
配当年次は開講学部のR Guideに掲載している科目表で確認してください。配当年次は開講学部のR Guideに掲載している科目表で確認してください。 |
| 先修規定/ Prerequisite RegulationsPrerequisite Regulations |
|
| 他学部履修可否/ Acceptance of Other CollegesAcceptance of Other Colleges |
履修登録システムの『他学部・他研究科履修不許可科目一覧』で確認してください。 |
| 履修中止可否/ Course CancellationCourse Cancellation |
〇(履修中止可/ Eligible for cancellation) |
| オンライン授業60単位制限対象科目/ Online Classes Subject to 60-Credit Upper LimitOnline Classes Subject to 60-Credit Upper Limit |
|
| 学位授与方針との関連/ Relationship with Degree PolicyRelationship with Degree Policy |
各授業科目は、学部・研究科の定める学位授与方針(DP)や教育課程編成の方針(CP)に基づき、カリキュラム上に配置されています。詳細はカリキュラム・マップで確認することができます。 https://www.rikkyo.ac.jp/about/disclosure/educational_policy/arts.html |
| 備考/ NotesNotes |
This course aims to develop a practical understanding of methods for organizing, analyzing, and visualizing data derived from digital publications.
Text mining refers to the entire process of exploring and analyzing large volumes of textual data. In this course, students will learn Python-based techniques for processing statistical data, using examples drawn from data organization and analysis in historical research.
| 1 | イントロダクション |
| 2 | 正規表現の基礎(1) |
| 3 | 正規表現の基礎(2) |
| 4 | 正規表現の応用(1):Internet Archiveから入手した統計データの整形 |
| 5 | 正規表現の応用(2):Internet Archiveから入手した統計データの整形 |
| 6 | KWIC分析:Voyant Toolsを用いた簡易テキスト分析 |
| 7 | データの抽出(1):SQL |
| 8 | データの抽出(2):SQL |
| 9 | Pythonによるデータ分析と可視化(1):Pythonの基礎 |
| 10 | Pythonによるデータ分析と可視化(2):データの概要をつかみ、基本的なグラフを出力する |
| 11 | Pythonによるデータ分析と可視化(3):Titanic datasetの分析 |
| 12 | Pythonによるデータ分析と可視化(4):Titanic datasetの分析 |
| 13 | Pythonによるデータ分析と可視化(5):Titanic datasetの分析 |
| 14 | まとめ |
板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above
授業内容に応じ、復習を兼ねた参考文献の熟読か成果物の提出を求める(各回約2時間程度)。
| 種類 (Kind) | 割合 (%) | 基準 (Criteria) |
|---|---|---|
| 平常点 (In-class Points) | 100 |
最終レポート(Final Report)(40%) 出席および授業参加度(30%) 授業内に指示した提出物(30%) |
| 備考 (Notes) | ||
| No | 著者名 (Author/Editor) | 書籍名 (Title) | 出版社 (Publisher) | 出版年 (Date) | ISBN/ISSN |
|---|---|---|---|---|---|
| 1 | クレール・ルメルシエ | 『人文学のための計量分析入門: 歴史を数量化する』 | 人文書院 | 2025 | 9784409511077 |
| その他 (Others) | |||||
| 随時、資料を配布する。 | |||||
| No | 著者名 (Author/Editor) | 書籍名 (Title) | 出版社 (Publisher) | 出版年 (Date) | ISBN/ISSN |
|---|---|---|---|---|---|
| 1 | 本橋智光ほか | 『改訂新版 前処理大全〜SQL/pandas/Polars実践テクニック』 | 技術評論社 | 2024 | 9784297141387 |
| 2 | 北川博之 | 『データベースシステム』 | オーム社 | 2020 | 9784274225161 |
| 3 | 小久保奈都弥 | 『データ分析者のためのPythonデータビジュアライゼーション入門』 | 翔泳社 | 2020 | 9784798163970 |
日本語でやり取りするための文章力・コミュニケーション力と作業に詰まった際に早めに質問する力を要求します。
大学の無線LANに接続できるように設定したノートPCを授業中に利用できるよう、十分に充電して持参してください。Google Colabを使用しますので、Google Driveの保存容量に余裕のあるアカウントを用意しておいてください。
電子公開された画像・テキストからデータを整理・分析する手法について、実践から理解することを目指す。
This course aims to develop a practical understanding of methods for organizing, analyzing, and visualizing data derived from digital publications.
テキストマイニングとは、大量のテキストを探索・分析するプロセス全体を指します。本授業では歴史学のデータ整理と分析を例に、統計データを処理する技術についてPythonを用いて学びます。
Text mining refers to the entire process of exploring and analyzing large volumes of textual data. In this course, students will learn Python-based techniques for processing statistical data, using examples drawn from data organization and analysis in historical research.
| 1 | イントロダクション |
| 2 | 正規表現の基礎(1) |
| 3 | 正規表現の基礎(2) |
| 4 | 正規表現の応用(1):Internet Archiveから入手した統計データの整形 |
| 5 | 正規表現の応用(2):Internet Archiveから入手した統計データの整形 |
| 6 | KWIC分析:Voyant Toolsを用いた簡易テキスト分析 |
| 7 | データの抽出(1):SQL |
| 8 | データの抽出(2):SQL |
| 9 | Pythonによるデータ分析と可視化(1):Pythonの基礎 |
| 10 | Pythonによるデータ分析と可視化(2):データの概要をつかみ、基本的なグラフを出力する |
| 11 | Pythonによるデータ分析と可視化(3):Titanic datasetの分析 |
| 12 | Pythonによるデータ分析と可視化(4):Titanic datasetの分析 |
| 13 | Pythonによるデータ分析と可視化(5):Titanic datasetの分析 |
| 14 | まとめ |
板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above
授業内容に応じ、復習を兼ねた参考文献の熟読か成果物の提出を求める(各回約2時間程度)。
| 種類 (Kind) | 割合 (%) | 基準 (Criteria) |
|---|---|---|
| 平常点 (In-class Points) | 100 |
最終レポート(Final Report)(40%) 出席および授業参加度(30%) 授業内に指示した提出物(30%) |
| 備考 (Notes) | ||
| No | 著者名 (Author/Editor) | 書籍名 (Title) | 出版社 (Publisher) | 出版年 (Date) | ISBN/ISSN |
|---|---|---|---|---|---|
| 1 | クレール・ルメルシエ | 『人文学のための計量分析入門: 歴史を数量化する』 | 人文書院 | 2025 | 9784409511077 |
| その他 (Others) | |||||
| 随時、資料を配布する。 | |||||
| No | 著者名 (Author/Editor) | 書籍名 (Title) | 出版社 (Publisher) | 出版年 (Date) | ISBN/ISSN |
|---|---|---|---|---|---|
| 1 | 本橋智光ほか | 『改訂新版 前処理大全〜SQL/pandas/Polars実践テクニック』 | 技術評論社 | 2024 | 9784297141387 |
| 2 | 北川博之 | 『データベースシステム』 | オーム社 | 2020 | 9784274225161 |
| 3 | 小久保奈都弥 | 『データ分析者のためのPythonデータビジュアライゼーション入門』 | 翔泳社 | 2020 | 9784798163970 |
日本語でやり取りするための文章力・コミュニケーション力と作業に詰まった際に早めに質問する力を要求します。
大学の無線LANに接続できるように設定したノートPCを授業中に利用できるよう、十分に充電して持参してください。Google Colabを使用しますので、Google Driveの保存容量に余裕のあるアカウントを用意しておいてください。