日本語

Course Code etc
Academic Year 2024
College College of Arts
Course Code AL237
Theme・Subtitle
Class Format Face to face (all classes are face-to-face)
Class Format (Supplementary Items)
Campus Lecture
Campus Ikebukuro
Semester Fall semester
DayPeriod・Room Wed.4
ログインして教室を表示する(Log in to view the classrooms.)
Credits 2
Course Number ART1400
Language Japanese
Class Registration Method Lottery Registration(定員:200人/ Capacity:200)
Assigned Year 配当年次は開講学部のR Guideに掲載している科目表で確認してください。
Prerequisite Regulations
Acceptance of Other Colleges 履修登録システムの『他学部・他研究科履修不許可科目一覧』で確認してください。
Course Cancellation 〇(履修中止可/ Eligible for cancellation)
Online Classes Subject to 60-Credit Upper Limit
Relationship with Degree Policy 各授業科目は、学部・研究科の定める学位授与方針(DP)や教育課程編成の方針(CP)に基づき、カリキュラム上に配置されています。詳細はカリキュラム・マップで確認することができます。
Notes

【Course Objectives】

The goal of this class is to learn the basic knowledge for analyzing natural languages (especially Japanese) and to be able to perform basic statistical processing using R.

【Course Contents】

Text mining refers to the entire process of exploring and analyzing large volumes of text data. Various methods of text mining have been proposed and are expected to continue to develop in the future, but its fundamentals remain the same - techniques and methods for handling language with computers (natural language processing), statistical analyses, and knowledge of language itself. In this class, students will learn the fundamentals of text mining using the statistical software R.

Japanese Items

【授業計画 / Course Schedule】

1 ガイダンスと分析の準備(RとRStudioのインストール)
2 Rの基礎・データの可視化
3 自然言語処理基礎(1) : コンピューターによるテキストの扱い(文字コード、正規表現、ファイル)
4 自然言語処理基礎(2) : ことばの単位、形態素解析
5 自然言語処理基礎(3) : コーパス、データ構造
6 統計基礎(1) : 言語統計の基礎(記述統計と確率分布)
7 統計基礎(2) : 統計的仮説検定
8 テキストマイニングの実例
9 統計発展(1) : 回帰分析
10 統計発展(2) : 多変量解析1(判断分析、クラスター分析)
11 統計発展(3) : 多変量解析2(主成分分析、コレスポンデンス分析)
12 テキストマイニング実習(1)
13 テキストマイニング実習(2)
14 その他の分析方法、および社会的な問題について。全体のまとめ。

【活用される授業方法 / Teaching Methods Used】

板書 /Writing on the Board
スライド(パワーポイント等)の使用 /Slides (PowerPoint, etc.)
上記以外の視聴覚教材の使用 /Audiovisual Materials Other than Those Listed Above
個人発表 /Individual Presentations
グループ発表 /Group Presentations
ディスカッション・ディベート /Discussion/Debate
実技・実習・実験 /Practicum/Experiments/Practical Training
学内の教室外施設の利用 /Use of On-Campus Facilities Outside the Classroom
校外実習・フィールドワーク /Field Work
上記いずれも用いない予定 /None of the above

【授業時間外(予習・復習等)の学修 / Study Required Outside of Class】

毎回、授業で行った内容と類似した課題を出すので、操作の意味を考えながら課題に取り組んでください。

【成績評価方法・基準 / Evaluation】

種類 (Kind)割合 (%)基準 (Criteria)
平常点 (In-class Points)100 課題(複数回)(60%)
出席および授業参加度(10%)
備考 (Notes)

【テキスト / Textbooks】

その他 (Others)
毎回、授業資料を配布する。

【参考文献 / Readings】

No著者名 (Author/Editor)書籍名 (Title)出版社 (Publisher)出版年 (Date)ISBN/ISSN
1 石川 慎一郎/前田 忠彦/山崎 誠 『言語研究のための統計入門』 くろしお出版 2010 9784874244982
2 石田 基広 『Rによるテキストマイニング入門 (第2版)』 森北出版 2017 9784627848429

【履修にあたって求められる能力 / Abilities Required to Take the Course】

【学生が準備すべき機器等 / Equipment, etc., that Students Should Prepare】

実習を行いますので、大学の無線LANに接続できるように設定したノートPCを授業中に利用できるよう十分に充電して持参してください。

【その他 / Others】

【注意事項 / Notice】