#-*- encoding:utf-8 -*-
a = ['北京','附近','的','租房']
b = ['附近','的']
print ",".join(a)
print ",".join(b)
print ",".join(set(a)-set(b))
分词去停用词
#-*- encoding:utf-8 -*-
import jieba
import jieba.analyse
#stopwords = {}.fromkeys([ line.rstrip() for line in open('stopword.txt') ])
stopwords = {}.fromkeys(['的', '附近'])
segs = jieba.cut('北京附近的租房', cut_all=False)
segs = [w.encode('utf8') for w in list(segs)] #特别注意此处转换,但是转换出来的包含u,表示Unicode编码
stopwords = list(stopwords)
print segs
print stopwords
fenci_key=",".join(list(set(segs)-set(stopwords)))
print fenci_key
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
机房租用,北京机房租用,IDC机房托管, http://www.fwqtg.net
相关推荐: chatgpt赋能python:Python版本切换教程
Python版本切换教程Python版本切换教程 Python是一种高级编程语言,用于多种编程任务。但是,由于Python版本之间的不兼容性,有时候需要切换Python版本以满足特定的需求。在本文中,我们将介绍Python版本切换的方法,包括安装和使用多个版本的Python。 安装多…