آموزش پردازش متن (Natural Language Processing)

اطلاعات دوره


مدت زمان
03:41:35
تعداد ویدیو
18
تعداد نظرات
5


مبلغ دوره :

130,000 تومان
گل‌آرا رفاهی

گل‌آرا رفاهی


مشاهده رزومه

سطح دوره: جامع
مبلغ دوره: 130,000 تومان
تاریخ درج: 1400/01/21
آخرین به روزرسانی: 1401/06/12
دسته بندی : هوش مصنوعی و دیتا ساینتس
نوع آموزش : پروژه محور

آموزش پردازش متن (Natural Language Processing)

در این دوره آموزش پردازش متن ابتدا باید بدانیم داده‌های ساخت‌نیافته و به طور خاص متن، تصاویر و ویدیوها حاوی حجم بالایی از اطلاعات هستند. با این حال به دلیل پیچیدگی ذ‌اتی پردازش و تجزیه و تحلیل این داده‌ها، افراد غالباً از صرف زمان و تلاش زیاد روی مجموعه داده‌های ساخت‌نیافته که در حکم کاوش معدن طلا هستند اجتناب می‌کنند.

پردازش زبان طبیعی (NLP) به بهره‌گیری از ابزارها، تکنیک‌ها و الگوریتم‌ها برای پردازش و درک داده‌های طبیعی مبتنی بر زبان مربوط است که معمولاً در قالب‌های ساخت‌نیافته‌ای مانند متن، سخنرانی و غیره وجود دارند.

حوزه‌ای تخصصی در علوم رایانه و هوش مصنوعی محسوب می‌شود که ریشه در زبانشناسی محاسباتی دارد. دغدغه اصلی این حوزه از علوم، طراحی و ساخت برنامه و سیستم‌هایی است که امکان تعامل بین ماشین‌ها و زبان‌های طبیعی را فراهم سازند و در طی زمان برای استفاده انسان تکامل پیدا کنند. از این رو در اغلب موارد این حوزه علمی به عنوان یک زمینه کم‌عمق و سطحی برای تحقیق نگریسته می‌شود و افراد تمایل دارند که بیشتر روی یادگیری ماشین و یادگیری آماری تمرکز کنند.

در این دوره به بررسی 4 موضوع زیر می پردازیم:

1) Tokenization

2) Word embedding

3) Deep (RNN, LSTM, GRU)

4) Transformers (BERT)

بعد از آموزش مطالب تئوری هر موضوع، تمام موارد آموزش داده شده را به صورت عملی در یک پروژه پیاده سازی می کنیم.

زبان برنامه نویسی مورد استفاده: Python

لینک دسترسی به پروژه اول (Tokenization):

https://github.com/GolaraRFI/persian-tokenizers

لینک دسترسی به پروژه دوم (Word Embedding):

https://github.com/GolaraRFI/persian-embedding

لینک دسترسی به پروژه سوم (Sentiment analysis):

https://github.com/GolaraRFI/sentiment-analysis

لینک دسترسی به پروژه چهارم (NER):

https://github.com/GolaraRFI/NER

 

سرفصل های دوره 

1 - معرفی tokenizer و پیاده سازی آن

2 - پیاده سازی و مقایسه ی چند tokenizer فارسی

3 - معرفی word embedding

4 - آموزش و ساخت مدل word embedding

5 - پیاده سازی آموزش و ساخت چند مدل word embedding

6 - تست مدل word embedding

7 - پیاده سازی تست چند مدل word embedding

8 - شبکه های RNN-1

9 - شبکه های RNN-2

10 - شبکه های RNN-3

11 - شبکه های LSTM و GRU

12 - شبکه های LSTM و GRU

13 - پیاده سازی RNN, LSTM, GRU

14 - معرفی شبکه ELMO

15 - معماری transformer

16 - معماری transformer

17 - شبکه BERT

18 - پیاده سازی NER با استفاده از BERT

 

قسمت های دوره

  • 1

    1 - معرفی tokenizer و پیاده سازی آن

    00:06:13 ورود
  • 2

    2 - پیاده سازی و مقایسه ی چند tokenizer فارسی

    00:25:29 ورود
  • 3

    3 - معرفی word embedding

    00:11:02 ورود
  • 4

    4 - آموزش و ساخت مدل word embedding

    00:14:00 ورود
  • 5

    5 - پیاده سازی آموزش و ساخت چند مدل word embedding

    00:12:44 ورود
  • 6

    6 - تست مدل word embedding

    00:07:19 ورود
  • 7

    7 - پیاده سازی تست چند مدل word embedding

    00:11:08 ورود
  • 8

    8 - شبکه های RNN-1

    00:09:25 ورود
  • 9

    9 - شبکه های RNN-2

    00:07:57 ورود
  • 10

    10 - شبکه های RNN-3

    00:10:35 ورود
  • 11

    11 - شبکه های LSTM و GRU

    00:10:00 ورود
  • 12

    12 - شبکه های LSTM و GRU

    00:09:10 ورود
  • 13

    13 - پیاده سازی RNN, LSTM, GRU

    00:22:46 ورود
  • 14

    14 - معرفی شبکه ELMO

    00:08:50 ورود
  • 15

    15 - معماری transformer

    00:10:41 ورود
  • 16

    16 - معماری transformer

    00:13:14 ورود
  • 17

    17 - شبکه BERT

    00:11:37 ورود
  • 18

    18 - پیاده سازی NER با استفاده از BERT

    00:19:25 ورود

نظرات

جهت درج نظر شما باید وارد حساب کاربری خود شوید.

دوره های مرتبط