課程中通過細(xì)致講解,使學(xué)員掌握該技術(shù)的本質(zhì)。具體收益包括:
1.掌握NLP基礎(chǔ);
2.關(guān)鍵詞提取與文本分類方法
3.文本向量化與句法分析方法
4.NLP與深度學(xué)習(xí)技術(shù)的相應(yīng)算法;
5.理解并掌握Tensorflow框架。
本次培訓(xùn)從實(shí)戰(zhàn)的角度對自然語言處理(NLP)進(jìn)行了全面的剖析,并結(jié)合實(shí)際案例分析和探討NLP的應(yīng)用場景,給NLP相關(guān)從業(yè)人員以指導(dǎo)和啟迪。
第一天上午
NLP入門與基礎(chǔ)介紹(一)
1.NLP的基本概念
2.NLP的發(fā)展歷程
3.NLP主要研究方向
1)句法語義分析
2)信息抽取
3)文本挖掘
4)機(jī)器翻譯
5)信息檢索
6)問答系統(tǒng)
7)對話系統(tǒng)
第一天下午
NLP入門與基礎(chǔ)介紹(二)
4.NLP的基礎(chǔ)
1)分詞
正向最大匹配算法
逆向最大匹配算法
雙向最大匹配算法
基于N-gram語言模型的分詞
基于HMM的分詞方法
基于CRF的分詞法法
2)文本基本處理
文本提取
正在表達(dá)式
本文統(tǒng)計(jì)
3)詞性標(biāo)注
基于最大熵的詞性標(biāo)注
基于統(tǒng)計(jì)最大概率輸出詞性
基于HMM詞性標(biāo)注
基于CRF的詞性標(biāo)注
4)命名實(shí)體識別
基于CRF的命名實(shí)體識別
5.案例
1)在線中文分詞系統(tǒng)實(shí)戰(zhàn)
2)命名實(shí)體識別接口開發(fā)
3)基于詞性標(biāo)注的關(guān)鍵詞提取
第二天上午
關(guān)鍵詞提取與文本分類(一)
1.關(guān)鍵詞提取概述
2.關(guān)鍵詞提取算法
1)TF-IDF
2)LSA/LSI算法
3)PLSA算法
4)LDA算法
第二天下午
關(guān)鍵詞提取與文本分類(二)
3.文本分類算法
1)樸素貝葉斯
2)線性分類器
3)支持向量機(jī)
4)Bagging模型
5)Boosting模型
6)淺層神經(jīng)網(wǎng)絡(luò)
4.案例
1)新聞主題提取
2)新聞分類實(shí)戰(zhàn)
第三天上午
文本向量化與句法分析(一)
1.文本向量化概述
2.文本向量化常用算法
1)詞袋算法
2)HashTF算法
3)Word2Vec算法
4)Glove算法
第三天下午
文本向量化與句法分析(二)
3.句法分析概述
4.句法分析常用算法
1)PCFG算法
2)條件隨機(jī)場算法
5.案例
1)文本情感分析的開發(fā)示例
2)基于依存句法分詞的問句相似度計(jì)算
第四天上午
NLP與深度學(xué)習(xí)(一)
1.深度學(xué)習(xí)概述
1)神經(jīng)網(wǎng)絡(luò)
2)損失函數(shù)
3)梯度下降
2.深度學(xué)習(xí)常用算法
1)CNN
2)RNN
3)GRU
4)LSTM
第四天下午
NLP與深度學(xué)習(xí)(二)
3.Tensorflow框架學(xué)習(xí)
1)Tensorflow簡介
2)Tensorflow安裝
3)Tensorflow基礎(chǔ)使用
圖(graphs)
會話(session)
張量(tensor)
變量(Variable)
4)Tensorflow線性回歸以及分類的簡單使用
5)Tensorflow中各種優(yōu)化器的介紹
4.案例
1)基于CNN的文本分類
2)基于RNN的歌詞生成
3)基于LSTM的機(jī)器翻譯
4)基于Seq2Seq的問答系統(tǒng)
第五天業(yè)內(nèi)經(jīng)驗(yàn)交流
覃老師 上海大學(xué)物理學(xué)碩士,創(chuàng)業(yè)公司合伙人,技術(shù)總監(jiān)。機(jī)器學(xué)習(xí),深度學(xué)習(xí)領(lǐng)域多年一線開發(fā)研究經(jīng)驗(yàn),精通算法原理與編程實(shí)踐。曾使用Tensorflow,Caffe,Keras等深度學(xué)習(xí)框架完成過多項(xiàng)圖像,語音,nlp,搜索相關(guān)的人工智能實(shí)際項(xiàng)目,研發(fā)經(jīng)驗(yàn)豐富。擁有兩項(xiàng)國家專利。同時(shí)具有多年授課培訓(xùn)經(jīng)驗(yàn),講課通熟易懂,代碼風(fēng)格簡潔清晰。
楊老師 計(jì)算機(jī)博士,目前就職于中科院某研究所,長期從事深度學(xué)習(xí)與機(jī)器學(xué)習(xí)研究工作,在NLP與CV領(lǐng)域有很深造詣,主持多項(xiàng)科技專項(xiàng),并帶領(lǐng)團(tuán)隊(duì)深入一線研發(fā)并落地,XXX視頻監(jiān)控與分析系統(tǒng)、XXX輿情監(jiān)控系統(tǒng)、XXX智能對話系統(tǒng)及 XXX森林防火無人機(jī)跟拍系統(tǒng)等。申請發(fā)明專利2項(xiàng)、部級科技進(jìn)步二等獎一次,在SIGIR、CIKM及AAAI的國際會議發(fā)表多篇文章。
趙老師 計(jì)算機(jī)博士,目前主要研究方向包括電子推薦、智能決策和大數(shù)據(jù)分析等。主持國家自然科學(xué)基金2項(xiàng)、中國博士后科研基金、上海市浦江人才、IBM Shared University Research以及多項(xiàng)企業(yè)合作課題等項(xiàng)目。已在《管理科學(xué)學(xué)報(bào)》、《系統(tǒng)工程學(xué)報(bào)》、Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等國內(nèi)外刊物和學(xué)術(shù)會議發(fā)表論文90多篇,其中被SCI、EI收錄40多篇。出版著作和教材《智能化的流程管理》、《客戶智能》、《商務(wù)智能(第四版)》、《商務(wù)智能 數(shù)據(jù)分析的管理視角(第三版)》、《數(shù)據(jù)挖掘?qū)嵱冒咐返榷嗖俊?/p>