- 4.0/5.0
- (1 نظرات)
- تعداد قسمت 18
- مدت زمان 03:41:42
- انتشار 1403/03/06
- آخرین ویرایش 1403/03/06
گلآرا رفاهی
مدرس دانشسرا
برچسب های محبوب
آموزش پردازش متن (Natural Language Processing)
- 4.0/5.0
- تعداد مهارتجو 38
- آخرین ویرایش 1403/03/06
- انتشار 1403/09/03
توضیحات آموزش پردازش متن (Natural Language Processing)
در این دوره آموزش پردازش متن ابتدا باید بدانیم دادههای ساختنیافته و به طور خاص متن، تصاویر و ویدیوها حاوی حجم بالایی از اطلاعات هستند. با این حال به دلیل پیچیدگی ذاتی پردازش و تجزیه و تحلیل این دادهها، افراد غالباً از صرف زمان و تلاش زیاد روی مجموعه دادههای ساختنیافته که در حکم کاوش معدن طلا هستند اجتناب میکنند.
پردازش زبان طبیعی (NLP) به بهرهگیری از ابزارها، تکنیکها و الگوریتمها برای پردازش و درک دادههای طبیعی مبتنی بر زبان مربوط است که معمولاً در قالبهای ساختنیافتهای مانند متن، سخنرانی و غیره وجود دارند.
حوزهای تخصصی در علوم رایانه و هوش مصنوعی محسوب میشود که ریشه در زبانشناسی محاسباتی دارد. دغدغه اصلی این حوزه از علوم، طراحی و ساخت برنامه و سیستمهایی است که امکان تعامل بین ماشینها و زبانهای طبیعی را فراهم سازند و در طی زمان برای استفاده انسان تکامل پیدا کنند. از این رو در اغلب موارد این حوزه علمی به عنوان یک زمینه کمعمق و سطحی برای تحقیق نگریسته میشود و افراد تمایل دارند که بیشتر روی یادگیری ماشین و یادگیری آماری تمرکز کنند.
در این دوره به بررسی 4 موضوع زیر می پردازیم:
1) Tokenization
2) Word embedding
3) Deep (RNN, LSTM, GRU)
4) Transformers (BERT)
بعد از آموزش مطالب تئوری هر موضوع، تمام موارد آموزش داده شده را به صورت عملی در یک پروژه پیاده سازی می کنیم.
زبان برنامه نویسی مورد استفاده: Python
لینک دسترسی به پروژه اول (Tokenization):
https://github.com/GolaraRFI/persian-tokenizers
لینک دسترسی به پروژه دوم (Word Embedding):
https://github.com/GolaraRFI/persian-embedding
لینک دسترسی به پروژه سوم (Sentiment analysis):
https://github.com/GolaraRFI/sentiment-analysis
لینک دسترسی به پروژه چهارم (NER):
https://github.com/GolaraRFI/NER
سرفصل های دوره
1 - معرفی tokenizer و پیاده سازی آن
2 - پیاده سازی و مقایسه ی چند tokenizer فارسی
3 - معرفی word embedding
4 - آموزش و ساخت مدل word embedding
5 - پیاده سازی آموزش و ساخت چند مدل word embedding
6 - تست مدل word embedding
7 - پیاده سازی تست چند مدل word embedding
8 - شبکه های RNN-1
9 - شبکه های RNN-2
10 - شبکه های RNN-3
11 - شبکه های LSTM و GRU
12 - شبکه های LSTM و GRU
13 - پیاده سازی RNN, LSTM, GRU
14 - معرفی شبکه ELMO
15 - معماری transformer
16 - معماری transformer
17 - شبکه BERT
18 - پیاده سازی NER با استفاده از BERT
قسمت های آموزش پردازش متن (Natural Language Processing)
2 - آموزش مقایسه ی چند tokenizer فارسی
00:25:29
3 - معرفی word embedding
00:11:02
4 - آموزش مدل word embedding- قسمت اول
00:14:00
5 - آموزش مدل word embedding- قسمت دوم
00:12:44
6 - تست مدل word embedding- قسمت اول
00:07:20
7 - تست مدل word embedding- قسمت دوم
00:11:08
8 - آموزش شبکه های RNN- قسمت اول
00:09:25
9 - آموزش شبکه های RNN- قسمت دوم
00:07:58
10 - آموزش شبکه های RNN- قسمت سوم
00:10:35
11 - آموزش شبکه های LSTM و GRU- قسمت اول
00:10:01
12 - آموزش شبکه های LSTM و GRU- قسمت دوم
00:09:11
13 - آموزش پیاده سازی RNN, LSTM, GRU
00:22:46
14 - آموزش شبکه ELMO
00:08:51
15 - آشنایی با معماری transformer- قسمت اول
00:10:41
16 - آشنایی با معماری transformer- قسمت دوم
00:13:15
17 - آموزش شبکه BERT
00:11:38
18 - آموزش پیاده سازی NER با استفاده از BERT
00:19:25
فایل پیوست آموزش پردازش متن (Natural Language Processing)
لینک گیت هاب
لینک دسترسی به پروژه ها