日本語 English
開講年度/ Academic YearAcademic Year |
20242024 |
科目設置学部/ CollegeCollege |
文学部/College of ArtsCollege of Arts |
科目コード等/ Course CodeCourse Code |
AL237/AL237AL237 |
テーマ・サブタイトル等/ Theme・SubtitleTheme・Subtitle |
|
授業形態/ Class FormatClass Format |
対面(全回対面)/Face to face (all classes are face-to-face)Face to face (all classes are face-to-face) |
授業形態(補足事項)/ Class Format (Supplementary Items)Class Format (Supplementary Items) |
|
授業形式/ Class StyleCampus |
講義/LectureLecture |
校地/ CampusCampus |
池袋/IkebukuroIkebukuro |
学期/ SemesterSemester |
秋学期/Fall semesterFall semester |
曜日時限・教室/ DayPeriod・RoomDayPeriod・Room |
水4/Wed.4 Wed.4 ログインして教室を表示する(Log in to view the classrooms.) |
単位/ CreditsCredits |
22 |
科目ナンバリング/ Course NumberCourse Number |
ART1400 |
使用言語/ LanguageLanguage |
日本語/JapaneseJapanese |
履修登録方法/ Class Registration MethodClass Registration Method |
抽選登録/Lottery RegistrationLottery Registration(定員:200人/ Capacity:200) |
配当年次/ Assigned YearAssigned Year |
配当年次は開講学部のR Guideに掲載している科目表で確認してください。配当年次は開講学部のR Guideに掲載している科目表で確認してください。 |
先修規定/ Prerequisite RegulationsPrerequisite Regulations |
|
他学部履修可否/ Acceptance of Other CollegesAcceptance of Other Colleges |
履修登録システムの『他学部・他研究科履修不許可科目一覧』で確認してください。 |
履修中止可否/ Course CancellationCourse Cancellation |
〇(履修中止可/ Eligible for cancellation) |
オンライン授業60単位制限対象科目/ Online Classes Subject to 60-Credit Upper LimitOnline Classes Subject to 60-Credit Upper Limit |
|
学位授与方針との関連/ Relationship with Degree PolicyRelationship with Degree Policy |
各授業科目は、学部・研究科の定める学位授与方針(DP)や教育課程編成の方針(CP)に基づき、カリキュラム上に配置されています。詳細はカリキュラム・マップで確認することができます。 |
備考/ NotesNotes |
The goal of this class is to learn the basic knowledge for analyzing natural languages (especially Japanese) and to be able to perform basic statistical processing using R.
Text mining refers to the entire process of exploring and analyzing large volumes of text data. Various methods of text mining have been proposed and are expected to continue to develop in the future, but its fundamentals remain the same - techniques and methods for handling language with computers (natural language processing), statistical analyses, and knowledge of language itself. In this class, students will learn the fundamentals of text mining using the statistical software R.
1 | ガイダンスと分析の準備(RとRStudioのインストール) |
2 | Rの基礎・データの可視化 |
3 | 自然言語処理基礎(1) : コンピューターによるテキストの扱い(文字コード、正規表現、ファイル) |
4 | 自然言語処理基礎(2) : ことばの単位、形態素解析 |
5 | 自然言語処理基礎(3) : コーパス、データ構造 |
6 | 統計基礎(1) : 言語統計の基礎(記述統計と確率分布) |
7 | 統計基礎(2) : 統計的仮説検定 |
8 | テキストマイニングの実例 |
9 | 統計発展(1) : 回帰分析 |
10 | 統計発展(2) : 多変量解析1(判断分析、クラスター分析) |
11 | 統計発展(3) : 多変量解析2(主成分分析、コレスポンデンス分析) |
12 | テキストマイニング実習(1) |
13 | テキストマイニング実習(2) |
14 | その他の分析方法、および社会的な問題について。全体のまとめ。 |
板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above
毎回、授業で行った内容と類似した課題を出すので、操作の意味を考えながら課題に取り組んでください。
種類 (Kind) | 割合 (%) | 基準 (Criteria) |
---|---|---|
平常点 (In-class Points) | 100 |
課題(複数回)(60%) 出席および授業参加度(10%) |
備考 (Notes) | ||
その他 (Others) | |||||
---|---|---|---|---|---|
毎回、授業資料を配布する。 |
No | 著者名 (Author/Editor) | 書籍名 (Title) | 出版社 (Publisher) | 出版年 (Date) | ISBN/ISSN |
---|---|---|---|---|---|
1 | 石川 慎一郎/前田 忠彦/山崎 誠 | 『言語研究のための統計入門』 | くろしお出版 | 2010 | 9784874244982 |
2 | 石田 基広 | 『Rによるテキストマイニング入門 (第2版)』 | 森北出版 | 2017 | 9784627848429 |
実習を行いますので、大学の無線LANに接続できるように設定したノートPCを授業中に利用できるよう十分に充電して持参してください。
自然言語(特に、日本語)を定量的に分析するための基礎的な知識を学び、Rを用いた基本的な統計処理ができるようになることを目標とする。
The goal of this class is to learn the basic knowledge for analyzing natural languages (especially Japanese) and to be able to perform basic statistical processing using R.
テキストマイニングとは、大量のテキストを探索・分析するプロセス全体を指します。これまでさまざまなテキストマイニングの方法が提案され、今後も発展していくことが予想されますが、基礎となるのは、言語をコンピュータで扱う技術(自然言語処理)、統計学、および、言語そのものに対する知識です。本授業では、テキストマイニングを行うための基礎的知識を、統計ソフトRを用いて学びます。
Text mining refers to the entire process of exploring and analyzing large volumes of text data. Various methods of text mining have been proposed and are expected to continue to develop in the future, but its fundamentals remain the same - techniques and methods for handling language with computers (natural language processing), statistical analyses, and knowledge of language itself. In this class, students will learn the fundamentals of text mining using the statistical software R.
1 | ガイダンスと分析の準備(RとRStudioのインストール) |
2 | Rの基礎・データの可視化 |
3 | 自然言語処理基礎(1) : コンピューターによるテキストの扱い(文字コード、正規表現、ファイル) |
4 | 自然言語処理基礎(2) : ことばの単位、形態素解析 |
5 | 自然言語処理基礎(3) : コーパス、データ構造 |
6 | 統計基礎(1) : 言語統計の基礎(記述統計と確率分布) |
7 | 統計基礎(2) : 統計的仮説検定 |
8 | テキストマイニングの実例 |
9 | 統計発展(1) : 回帰分析 |
10 | 統計発展(2) : 多変量解析1(判断分析、クラスター分析) |
11 | 統計発展(3) : 多変量解析2(主成分分析、コレスポンデンス分析) |
12 | テキストマイニング実習(1) |
13 | テキストマイニング実習(2) |
14 | その他の分析方法、および社会的な問題について。全体のまとめ。 |
板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above
毎回、授業で行った内容と類似した課題を出すので、操作の意味を考えながら課題に取り組んでください。
種類 (Kind) | 割合 (%) | 基準 (Criteria) |
---|---|---|
平常点 (In-class Points) | 100 |
課題(複数回)(60%) 出席および授業参加度(10%) |
備考 (Notes) | ||
その他 (Others) | |||||
---|---|---|---|---|---|
毎回、授業資料を配布する。 |
No | 著者名 (Author/Editor) | 書籍名 (Title) | 出版社 (Publisher) | 出版年 (Date) | ISBN/ISSN |
---|---|---|---|---|---|
1 | 石川 慎一郎/前田 忠彦/山崎 誠 | 『言語研究のための統計入門』 | くろしお出版 | 2010 | 9784874244982 |
2 | 石田 基広 | 『Rによるテキストマイニング入門 (第2版)』 | 森北出版 | 2017 | 9784627848429 |
実習を行いますので、大学の無線LANに接続できるように設定したノートPCを授業中に利用できるよう十分に充電して持参してください。