2021-10-08
75
序列分类,预测整个输入序列的类别标签。情绪分析,预测用户撰写文字话题态度。预测选举结果或产品、电影评分。国际电影数据库(International Movie Database)影评数据集。目标值二元,正面或负面。语言大量否定、反语、模糊,不能只看单词是否出现。构建词向量循环网络,逐个单词查看每条评论,最后单词话性值训练预测整条评论情绪分类器。斯担福大学人工智能实验室的IMDB影评数据集: http://ai.stanford.edu/~amaas/data/sentiment/ 。压缩tar文档,正面负
2021-10-08
168
Windows环境:安装whl包:pip install wheel -> pip install **.whl安装tar.gz包:cd到解压后路径,python setup.py install
Linux环境:安装whl同上安装tar.gz:cd到解压后路径,./configure -> make -> make install以上就是Python_安装官方whl包和ta
2021-10-08
147
SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。MIT许可下发行。其 github 主页我自己修改了上文链接中的python代码并加入些许注释,以方便你的理解:12from
2021-10-08
117
词向量嵌入需要高效率处理大规模文本语料库。word2vec。简单方式,词送入独热编码(one-hot encoding)学习系统,长度为词汇表长度的向量,词语对应位置元素为1,其余元素为0。向量维数很高,无法刻画不同词语的语义关联。共生关系(co-occurrence)表示单词,解决语义关联,遍历大规模文本语料库,统计每个单词一定距离范围内的周围词汇,用附近词汇规范化数量表示每个词语。类似语境中词语语义相似。用PCA或类似方法降维出现向量(occurrence vector),得到更稠密表示。性能好,追踪
2021-10-08
66
思路: 1、参考模型,这个作业我参考了linux的登录认证流程以及结合网上银行支付宝等锁定规则; 1)认证流程参考的是Linux的登录:当你输入完用户名密码后再验证用户名是否存在用户是否被锁定,然后在验证密码是否正确,如果验证不过去只会告诉你验证失败,而不告诉你到底是用户名错误还是密码错误,增加了暴力破解的难度; 2)关于输入错误次数的计数和锁定,我参考的是银行和支付宝的做法,也就是只关心你输错了多少次,不关心输对了多少次,也就是说输错了两次,第三次输对了,前面的计数不清
2021-10-08
320
编写登陆接口 1.输入用户名和密码 2.认证成功后显示欢迎信息 3.输错三次后锁定 思路:要求是编写登陆接口,那么要有一个存放用户信息的模块;三次后锁定,要有一个存放锁定用户信息的模块;我们知道,保存用户信息有两种方式,一种是数据库保存,一种是文件保存,现在我们只学习了文件保存,因此要有两个文件,一个是用户信息文件,一个是锁定用户信息文件。 要从文件中读取信息,添加信息,修改信息。 readme: (1)用户输入用户名; (2)用户名去锁定文件中验证是
2021-10-08
60
1. 字符串长度#strlen(str) # 字符串长度函数名str= 'apples' # 把字符串 "apples" 赋值给变量 strprint (len(str)) # 打印字符串的长度 2. 查找字符#strchr(str1,str2) # 查找字符函数名str1 = 'apples' str2 = 'e'result = str1.index(str2) # 在字符串str1中查找字符str2print (resul
2021-10-08
58
Hello,Everyone! Python是个好东西!好吧,以黎某人这寒碜的赞美之词,实在上不了台面,望见谅。那我们直接来上干货吧。第一步:下载Python安装包1.进入Python官网,点击download 2.进入之后有两个安装包供选择(Python会根据你系统的位数智能选择,所以这里不用纠结你的电脑是32位的还是64位) 我的建议是下载Python3.0后面的版本,因为Python3在Python2的基础上,优化改进了一些代码格式。点击下载。3.开始安装。系统默认你的Python安装在C盘里面,