一个集合去掉另一个集合中的内容，可以用来去停用词 - 服务器托管|北京服务器租用|机房托管租用|IDC托管租用|机房机柜带宽租用-价格及费用咨询

#-*- encoding:utf-8 -*-

a = ['北京','附近','的','租房']
b = ['附近','的']

print ",".join(a)
print ",".join(b)
print ",".join(set(a)-set(b))

分词去停用词

#-*- encoding:utf-8 -*-
import jieba
import jieba.analyse

#stopwords = {}.fromkeys([ line.rstrip() for line in open('stopword.txt') ])
stopwords = {}.fromkeys(['的', '附近'])
segs = jieba.cut('北京附近的租房', cut_all=False)
segs = [w.encode('utf8') for w in list(segs)] #特别注意此处转换,但是转换出来的包含u，表示Unicode编码
stopwords = list(stopwords)
print segs
print stopwords
fenci_key=",".join(list(set(segs)-set(stopwords)))
print fenci_key

服务器托管，北京服务器托管，服务器租用 http://www.fwqtg.net
机房租用，北京机房租用，IDC机房托管， http://www.fwqtg.net

相关推荐: chatgpt赋能python：Python版本切换教程
Python版本切换教程

Python版本切换教程 Python是一种高级编程语言，用于多种编程任务。但是，由于Python版本之间的不兼容性，有时候需要切换Python版本以满足特定的需求。在本文中，我们将介绍Python版本切换的方法，包括安装和使用多个版本的Python。安装多…

服务器托管，北京服务器托管，服务器租用，机房机柜带宽租用