按道理来讲这篇笔记该第一个发的,但是笔者整理笔记的时候觉得这章不重要就直接跳过了。这章的内容也确实不难,大部分内容也是了解即可,为数不多需要记的就是那几个常用的正则表达式和字符编辑距离的计算(话说这算法被出成动态规划算法题出现在各位的考试中的概率真不低)。总之要是你要是按笔者发布笔记的时间顺序阅读的NLP部分笔记的话,那就把这章内容当成消遣吧,这章节相较于其他章节简直就像是数学多选题第一道相较于解析几何大题。

摘要:语料库,词汇知识库,数据爬虫,ASCII码,中文字符编码,Unicode码及其应用(UTF-8等),字符编辑距离,正则表达式

1.自然语言处理基础.pdf

呃...你...您好?