专利名称:广告分类方法、装置及服务器专利类型:发明专利
发明人:宋亚娟,肖磊,柳金晶,胡少锋申请号:CN201310516732.1申请日:20131028公开号:CN104572775A公开日:20150429
摘要:本发明公开了一种广告分类方法、装置及服务器,属于信息技术领域。所述方法包括:根据待分类的广告的文本信息,得到该文本信息的多个特征词;根据每个特征词在该文本信息中的统计信息以及该每个特征词在已知商品标题中的统计信息,获取该每个特征词的词频-逆文档频率TFIDF值作为该每个特征词的权值;根据该每个特征词的权值、该广告的分类信息以及预设分类模型,获取该广告的类目。本发明通过将每个预设类目对应的商品标题作为已知商品标题和语料库,避免了采用人工标注的方式来选取广告中的数据,从而减少了对广告分类所消耗的时间,同时将广告的分类信息对应的特征也加入到预设分类模型中计算,从而提高了广告分类的精度。
申请人:深圳市腾讯计算机系统有限公司
地址:518000 广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼
国籍:CN
代理机构:北京三高永信知识产权代理有限责任公司
代理人:关文魁
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容