پردازش متن (Natural Language Processing)
اطلاعات دوره
مبلغ دوره :
سطح دوره: | جامع |
مبلغ دوره: | 130,000 تومان |
تاریخ درج: | 1400/01/21 |
---|---|
آخرین به روزرسانی: | 1400/04/20 |
پردازش متن (Natural Language Processing)
دادههای ساختنیافته و به طور خاص متن، تصاویر و ویدیوها حاوی حجم بالایی از اطلاعات هستند. با این حال به دلیل پیچیدگی ذاتی پردازش و تجزیه و تحلیل این دادهها، افراد غالباً از صرف زمان و تلاش زیاد روی مجموعه دادههای ساختنیافته که در حکم کاوش معدن طلا هستند اجتناب میکنند.
پردازش زبان طبیعی (NLP) به بهرهگیری از ابزارها، تکنیکها و الگوریتمها برای پردازش و درک دادههای طبیعی مبتنی بر زبان مربوط است که معمولاً در قالبهای ساختنیافتهای مانند متن، سخنرانی و غیره وجود دارند.
حوزهای تخصصی در علوم رایانه و هوش مصنوعی محسوب میشود که ریشه در زبانشناسی محاسباتی دارد. دغدغه اصلی این حوزه از علوم، طراحی و ساخت برنامه و سیستمهایی است که امکان تعامل بین ماشینها و زبانهای طبیعی را فراهم سازند و در طی زمان برای استفاده انسان تکامل پیدا کنند. از این رو در اغلب موارد این حوزه علمی به عنوان یک زمینه کمعمق و سطحی برای تحقیق نگریسته میشود و افراد تمایل دارند که بیشتر روی یادگیری ماشین و یادگیری آماری تمرکز کنند.
در این دوره به بررسی 4 موضوع زیر می پردازیم:
1) Tokenization
2) Word embedding
3) Deep (RNN, LSTM, GRU)
4) Transformers (BERT)
بعد از آموزش مطالب تئوری هر موضوع، تمام موارد آموزش داده شده را به صورت عملی در یک پروژه پیاده سازی می کنیم.
زبان برنامه نویسی مورد استفاده: Python
لینک دسترسی به پروژه اول (Tokenization):
https://github.com/GolaraRFI/persian-tokenizers
لینک دسترسی به پروژه دوم (Word Embedding):
https://github.com/GolaraRFI/persian-embedding
لینک دسترسی به پروژه سوم (Sentiment analysis):
https://github.com/GolaraRFI/sentiment-analysis
لینک دسترسی به پروژه چهارم (NER):
قسمت های دوره
-
1
1 - معرفی tokenizer و پیاده سازی آن
00:06:13 ورود -
2
2 - پیاده سازی و مقایسه ی چند tokenizer فارسی
00:25:29 ورود -
3
3 - معرفی word embedding
00:11:02 ورود -
4
4 - آموزش و ساخت مدل word embedding
00:14:00 ورود -
5
5 - پیاده سازی آموزش و ساخت چند مدل word embedding
00:12:44 ورود -
6
6 - تست مدل word embedding
00:07:19 ورود -
7
7 - پیاده سازی تست چند مدل word embedding
00:11:08 ورود -
8
8 - شبکه های RNN-1
00:09:25 ورود -
9
9 - شبکه های RNN-2
00:07:57 ورود -
10
10 - شبکه های RNN-3
00:10:35 ورود -
11
11 - شبکه های LSTM و GRU
00:10:00 ورود -
12
12 - شبکه های LSTM و GRU
00:09:10 ورود -
13
13 - پیاده سازی RNN, LSTM, GRU
00:22:46 ورود -
14
14 - معرفی شبکه ELMO
00:08:50 ورود -
15
15 - معماری transformer
00:10:41 ورود -
16
16 - معماری transformer
00:13:14 ورود -
17
17 - شبکه BERT
00:11:37 ورود -
18
18 - پیاده سازی NER با استفاده از BERT
00:19:25 ورود