创建自己的应用
百度研发的预训练模型ERNIE在处理中文任务上自称超越了Bert模型,本次教程以文本的情感分类作为例子,首先在控制台找到nlp模块
然后创建自己的应用,个人申请的时候应该是不需要审核的,之后就可以看到自己应用下的三个参数: 这三个参数是用来鉴权(oauth2.0认证方式,感兴趣可以自行百度)的,在调用百度AI的接口时需要用到。
接口调用支持以下语言:
- NLP-Java-SDK (Java)
- NLP-PHP-SDK (PHH)
- NLP-Cpp-SDK (C)
- NLP-Node-SDK (nodejs)
- NLP-Python-SDK (python)
- NLP-C#-SDK (C#)
本人实验了python和Java两种方式,使用python比较方便,在数据预处理中可以使用其他的包,但是接口链接时的配置官方给出的不是很全面,而Java相反,可以配置很多调用接口的客户端的一些链接参数,但是数据预处理不方便。
python方式调用
安装Python SDK
创建一个 Python SDK客户端
配置AipNlp
如果用户需要配置AipNlp的网络请求参数(一般不需要配置),可以在构造AipNlp之后调用接口设置参数,目前只支持以下参数:
调用接口
情感倾向分析
对包含主观观点信息的文本进行情感极性类别(积极、消极、中性)的判断,并给出相应的置信度。
返回参数
需要注意的几个点
- 单次接口调用的并发量是2,会员是5,意思就是每秒钟只能调用2次。
- 文本的编码方式必须是格式,在传入之前可以自行编码
- 长文本无法处理,特定任务支持的最大长度不一样,可以参考API文档
其他接口nlp任务接口可自行查看客户端的源码或者是官方API文档点击查看