課程中通過細致講解,使學員掌握該技術的本質(zhì)。具體收益包括:
1.掌握NLP基礎;
2.關鍵詞提取與文本分類方法
3.文本向量化與句法分析方法
4.NLP與深度學習技術的相應算法;
5.理解并掌握Tensorflow框架。
本次培訓從實戰(zhàn)的角度對自然語言處理(NLP)進行了全面的剖析,并結合實際案例分析和探討NLP的應用場景,給NLP相關從業(yè)人員以指導和啟迪。
第一天上午
NLP入門與基礎介紹(一)
1.NLP的基本概念
2.NLP的發(fā)展歷程
3.NLP主要研究方向
1)句法語義分析
2)信息抽取
3)文本挖掘
4)機器翻譯
5)信息檢索
6)問答系統(tǒng)
7)對話系統(tǒng)
第一天下午
NLP入門與基礎介紹(二)
4.NLP的基礎
1)分詞
正向最大匹配算法
逆向最大匹配算法
雙向最大匹配算法
基于N-gram語言模型的分詞
基于HMM的分詞方法
基于CRF的分詞法法
2)文本基本處理
文本提取
正在表達式
本文統(tǒng)計
3)詞性標注
基于最大熵的詞性標注
基于統(tǒng)計最大概率輸出詞性
基于HMM詞性標注
基于CRF的詞性標注
4)命名實體識別
基于CRF的命名實體識別
5.案例
1)在線中文分詞系統(tǒng)實戰(zhàn)
2)命名實體識別接口開發(fā)
3)基于詞性標注的關鍵詞提取
第二天上午
關鍵詞提取與文本分類(一)
1.關鍵詞提取概述
2.關鍵詞提取算法
1)TF-IDF
2)LSA/LSI算法
3)PLSA算法
4)LDA算法
第二天下午
關鍵詞提取與文本分類(二)
3.文本分類算法
1)樸素貝葉斯
2)線性分類器
3)支持向量機
4)Bagging模型
5)Boosting模型
6)淺層神經(jīng)網(wǎng)絡
4.案例
1)新聞主題提取
2)新聞分類實戰(zhàn)
第三天上午
文本向量化與句法分析(一)
1.文本向量化概述
2.文本向量化常用算法
1)詞袋算法
2)HashTF算法
3)Word2Vec算法
4)Glove算法
第三天下午
文本向量化與句法分析(二)
3.句法分析概述
4.句法分析常用算法
1)PCFG算法
2)條件隨機場算法
5.案例
1)文本情感分析的開發(fā)示例
2)基于依存句法分詞的問句相似度計算
第四天上午
NLP與深度學習(一)
1.深度學習概述
1)神經(jīng)網(wǎng)絡
2)損失函數(shù)
3)梯度下降
2.深度學習常用算法
1)CNN
2)RNN
3)GRU
4)LSTM
第四天下午
NLP與深度學習(二)
3.Tensorflow框架學習
1)Tensorflow簡介
2)Tensorflow安裝
3)Tensorflow基礎使用
圖(graphs)
會話(session)
張量(tensor)
變量(Variable)
4)Tensorflow線性回歸以及分類的簡單使用
5)Tensorflow中各種優(yōu)化器的介紹
4.案例
1)基于CNN的文本分類
2)基于RNN的歌詞生成
3)基于LSTM的機器翻譯
4)基于Seq2Seq的問答系統(tǒng)
第五天業(yè)內(nèi)經(jīng)驗交流
覃老師 上海大學物理學碩士,創(chuàng)業(yè)公司合伙人,技術總監(jiān)。機器學習,深度學習領域多年一線開發(fā)研究經(jīng)驗,精通算法原理與編程實踐。曾使用Tensorflow,Caffe,Keras等深度學習框架完成過多項圖像,語音,nlp,搜索相關的人工智能實際項目,研發(fā)經(jīng)驗豐富。擁有兩項國家專利。同時具有多年授課培訓經(jīng)驗,講課通熟易懂,代碼風格簡潔清晰。
楊老師 計算機博士,目前就職于中科院某研究所,長期從事深度學習與機器學習研究工作,在NLP與CV領域有很深造詣,主持多項科技專項,并帶領團隊深入一線研發(fā)并落地,XXX視頻監(jiān)控與分析系統(tǒng)、XXX輿情監(jiān)控系統(tǒng)、XXX智能對話系統(tǒng)及 XXX森林防火無人機跟拍系統(tǒng)等。申請發(fā)明專利2項、部級科技進步二等獎一次,在SIGIR、CIKM及AAAI的國際會議發(fā)表多篇文章。
趙老師 計算機博士,目前主要研究方向包括電子推薦、智能決策和大數(shù)據(jù)分析等。主持國家自然科學基金2項、中國博士后科研基金、上海市浦江人才、IBM Shared University Research以及多項企業(yè)合作課題等項目。已在《管理科學學報》、《系統(tǒng)工程學報》、Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等國內(nèi)外刊物和學術會議發(fā)表論文90多篇,其中被SCI、EI收錄40多篇。出版著作和教材《智能化的流程管理》、《客戶智能》、《商務智能(第四版)》、《商務智能 數(shù)據(jù)分析的管理視角(第三版)》、《數(shù)據(jù)挖掘?qū)嵱冒咐返榷嗖俊?/p>
對此課程感興趣的學員