python统计文本字符串里单词出现频率的方法

　　本文实例讲述了python统计文本字符串里单词出现频率的方法。分享给大家供大家参考。具体实现方法如下：

　　?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

# word frequency in a text
# tested with Python24 vegaseat 25aug2005
# Chinese wisdom ...
str1 = """Man who run in front of car, get tired.
Man who run behind car, get exhausted."""
print "Original string:"
print str1
print
# create a list of words separated at whitespaces
wordList1 = str1.split(None)
# strip any punctuation marks and build modified word list
# start with an empty list
wordList2 = []
for word1 in wordList1:
# last character of each word
lastchar = word1[-1:]
# use a list of punctuation marks
if lastchar in [",", ".", "!", "?", ";"]:
word2 = word1.rstrip(lastchar)
else:
word2 = word1
# build a wordList of lower case modified words
wordList2.append(word2.lower())
print "Word list created from modified string:"
print wordList2
print
# create a wordfrequency dictionary
# start with an empty dictionary
freqD2 = {}
for word2 in wordList2:
freqD2[word2] = freqD2.get(word2, 0) + 1
# create a list of keys and sort the list
# all words are lower case already
keyList = freqD2.keys()
keyList.sort()
print "Frequency of each word in the word list (sorted):"
for key2 in keyList:
print "%-10s %d" % (key2, freqD2[key2])

　　希望本文所述对大家的Python程序设计有所帮助。

时间： 2024-11-03 01:03:44

python统计文本字符串里单词出现频率的方法的相关文章

python清除字符串里非字母字符的方法

本文实例讲述了python清除字符串里非字母字符的方法.分享给大家供大家参考.具体如下: ? 1 2 3 4 5 6 7 8 9 s = "hello world! how are you? 0" # Short version print filter(lambda c: c.isalpha(), s) # Faster version for long ASCII strings: id_tab = "".join(map(chr, xrange(256))

php解析字符串里所有URL地址的方法_php技巧

本文实例讲述了php解析字符串里所有URL地址的方法.分享给大家供大家参考.具体如下: <?php // $html = the html on the page // $current_url = the full url that the html came from //(only needed for $repath) // $repath = converts ../ and / and // urls to full valid urls function pageLinks($ht

php字符串按照单词进行反转的方法

本文实例讲述了php字符串按照单词进行反转的方法.分享给大家供大家参考.具体分析如下: 下面的php代码可以将字符串按照单词进行反转输出,实际上市现将字符串按照空格分隔到数组,然后对数组进行反转输出 <?php $s = "Reversing a string by word"; // break the string up into words $words = explode(' ',$s); // reverse the array of words $words = a

php字符串按照单词进行反转的方法_php技巧

本文实例讲述了php字符串按照单词进行反转的方法.分享给大家供大家参考.具体分析如下: 下面的php代码可以将字符串按照单词进行反转输出,实际上市现将字符串按照空格分隔到数组,然后对数组进行反转输出 <?php $s = "Reversing a string by word"; // break the string up into words $words = explode(' ',$s); // reverse the array of words $words = ar

【Python学习】字符串按单词反转

第一天学python,做一个作业题目:字符串按单词反转(必须保留所有空格).'I love china!' 转化为 'china! love I' import string s = 'I love china!' s1=list(s.split()) #构建一个空数组 x=[] #反向遍历数组 for c in reversed(s1): x.append(c) #按空格连接字符串 print(' '.join(x)) 问题来了,用split()进行分割会存在问题,没法保留空格,好吧,那看

python处理文本字符串例子

需求: 对一个配置文件进行处理,拿出可用的字符来拼接,下面是原始文本,我们要得到这样的结果, redis -h 127.0.0.1 -p 6379 | select 2 redis -h 127.0.0.1 -p 6379 | select 16 redis -h 127.0.0.1 -p 6379 | select 8 原始文本: 代码如下复制代码 PHP 'redis_list' => array( 'normal' => array(

php解析字符串里所有URL地址的方法

具体如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 <?php // $html = the html on the page // $current_url = the full url that the html came from //(only needed for

python清除字符串里非数字字符的方法

本文实例讲述了python清除字符串里非数字字符的方法.分享给大家供大家参考.具体如下: ? 1 2 3 4 import re s = "how19 a*re 254y**ou?" # Using regular expressions print re.sub("D", "", s) 希望本文所述对大家的Python程序设计有所帮助.

python统计文本文件内单词数量的方法

本文实例讲述了python统计文本文件内单词数量的方法.分享给大家供大家参考.具体实现方法如下: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 # count lines, sentences, and words of a text file # set all the counters to zero lines, bla

猜你喜欢

ubuntu下安装和卸载VMWARE PLAYER

比如下载下来的VMware Player文件名为 VMware-Player-3.1.0-261024.i386.bundle 在终端中转到文件放置的目录,执行 sudo sh VMware-Play ...

link中Take(1)和 First()有什么区别？

问题描述 link中Take(1)和 First()有什么区别? link中Take(1)和 First()有什么区别? 解决方案 Take(1)返回的是序列,包含一个元素 First返回的是单个元素

PS为婚纱艺术照调出浪漫怀旧蓝色调教程

教程介绍暗蓝色图片的调色方法.过程也比较简单,只要把暗调部分的选区选取出来,新建图层后用暗蓝色填充,再适当改变图层混合模式记得得到蓝色图片,后期增加一些补色即可. 原图最终效果 1.打开原图素材,创 ...

ASP提速技巧五则

技巧技巧之一:提高使用Request集合的效率访问一个ASP集合来提取一个值是费时的.占用计算资源的过程.因为这个操作包含了一系列对相关集合的搜索,这比访问一个局部变量要慢得多.因此,如果打算在页 ...

Fireworks制作钟摆式公告牌摇摆动画

今天我们用Fireworks制作一个钟摆式的公告牌. 先参阅一下效果图. 1.新建一个文件,画布背景颜色选取白色.同时将画布大小设置稍大些. 2.使用Fwmx2004的矢量工具,绘制圆角矩形,自选一种 ...

ASP.NET中文显示之两种解决方法

asp.net|解决|显示|中文作者刚开始写ASP+程序时候碰到的第一个比较大的问题就是中文显示问题,运行后发现ASP+从数据库中读取出来的中文全部变成了?????????????,有点类似jsp中 ...

整合搜索优化一：新闻搜索

整合搜索与2007年年底由谷歌首先推出,随后被所有主流搜索引擎所采用.所谓整合搜索,就是在正常搜索结果页面中同时显示了文字页面之外的图片.视频.新闻.博客.地图.图书等垂直搜索结果.其实所有主流搜索引 ...

外链的起起浮浮是源于搜索引擎的数据删除

前几天百度大更新,许多网站收录和外链成倍增加.但昨天晚上有人在群里聊天说外链大降了,问我这是怎么回事,这刚升上来的外链,怎么会这么快又降下去了呢?真是令人不解啊,我问他你网站的关键词排名有没有下降呢? ...

论我国旅游商品的包装(上)

摘要:目前我国旅游行业普遍不重视旅游商品的包装,然而,众所周知,旅游商品包装的精美度如何对旅游者有不同的吸引力,贴切.适宜.合理的旅游商品包装能提高旅游者消费.基于以上问题本文从分析旅游商品的概念入手 ...

活动目录系列之四：单域环境的实现（多站点）--基本配置

在上期我们学习了活动目录系列之二:单域环境的实现(单站点) ,当时我们实现的是在一个站点的情况下.下面我们来看这样一个场景: **一个企业总部在北京,在上海和广东各有其办公区域, 要求实现活动目录域 ...

笔记本电脑散热差原因解析

有人说,散热问题只存在在游戏本上,像商务本本身发热量就小,不会存在散热问题.但是事实是这样么?有些设计不合理的笔记本电脑发热量大,别说玩游戏了,就是普通办公上网时都能感觉到键盘.硬盘.CPU风扇区域热 ...

win7系统怎么清理c盘

win7系统怎么清理c盘?在win7系统中清理c盘,我们可以使用系统自带的清理工具来操作. 右键点击c盘,打开属性窗口,点击常规中的磁盘清理. 在磁盘清理中勾选想要清理的内容,点击确定即可. 我们 ...

格式工厂显示“Error 0x1:函数不正确”

一:先要看原来的视频能不能用一种播放器播放,如果不能则有可能是原视频有问题如果原视频能用一种播放器播放则可能是格式工厂软件安装出了问题 ,可尝试重新安装格式工厂二:直接把文件后缀名右键重命 ...

javascript中Date对象应用之简易日历实现_javascript技巧

前面的话简易日历作为javascript中Date对象的常见应用,用途较广泛,本文将详细说明简易日历的实现思路. 效果演示 HTML说明使用type=number的两个input分别作为年和 ...

Ubuntu中设置samba共享可读写文件夹

首先当然是要安装samba了,呵呵: 代码: sudo apt-get install samba sudo apt-get install smbfs 下面我们来共享群组可读写文件夹,假设你要共 ...

从 Visual Studio 2017 谈起，解析微软技术生态进化之道

曾经被业界取笑「闭关锁国」的微软如今也走向了「改革开放」的道路,Visual Studio 2017的发布,不仅是VS二十周年的大事件,更是微软技术生态焕然一新的直观体验.以前只支持Windows及自 ...

从客户端访问一个客户端本地的csv文件，然后读取值，写入服务器的数据库。

问题描述从客户端访问一个客户端本地的csv文件,然后读取值,写入服务器的数据库.能否实现这样的功能,web页面是否具备读取客户端本地文件的能力,我测试的时候服务端和客户端都是一个电脑的时候没有问题, ...

求助！一个二叉树程序创建和遍历的程序

问题描述求助!一个二叉树程序创建和遍历的程序 #include #include typedef char ElementType; typedef struct BiNode{ ElementTy ...

C# DataSet.RejectChanges 方法

回滚自创建 DataSet 以来或上次调用 DataSet.AcceptChanges 以来对其进行的所有更改. 调用 DataSet.RejectChanges 以针 ...

How Does Alibaba Cloud Power the Biggest Online Shopping Festival?

Author: Alibaba Group Senior Staff Engineer Ding Yu Have you ever wondered what the underlying techn ...

阿里调整组织架构电商“大平台”之路启航

中介交易 SEO诊断淘宝客云主机技术大厅在与雅虎达成股权回购协议,并成功将子公司B2B私有化之后,阿里巴巴集团的新一轮征程终于开启. 昨日(7月23日),阿里巴巴集团宣布将进行组织架构的调整. ...

问题标签用户 spring MVC 3.1 ehcache 缓存无效

问题描述我的spring中配置的ehcache<beanid="cacheManagerFactory"class="org.springframework.ca ...

可不可以将listView赋予另一个listView(C#)

问题描述调试过有值传过来,控件没有内容:高手帮忙看看(急)privateListViewMyListView;privateListViewItemaItem;publicListViewmy_tt ...

libevent数据接收问题..

问题描述 libevent数据接收问题.. 我客户端一直循环的去发送数据.比如发送1-20000.我发现在libevent服务端出现监听事件丢失.执行的事件并没有20000次.请各位大神们给出一些建议 ...

C++构造函数、拷贝构造函数、赋值运算符漫谈（二）——函数返回值

首先我们先看一下C程序的返回值处理情况,我们知道当C函数返回int等小型数据时直接将返回值放入eax寄存器.那当返回大的数据结构又是如何处理呢?看如下一段代码: #include <stdio ...

缓存-hibernate中session的作用解释，求教~~

问题描述 hibernate中session的作用解释,求教~~ <精通hibernate:java对象持久化技术详解>中提到session缓存的三种作用:减少DB的访问次数.保证同步.* ...

excel导入到ＳＱＬ问题

问题描述 privatevoidButton1_Click(objectsender,System.EventArgse){SqlConnectioncon=newSqlConnection(&quo ...

Ajax简单的异步交互及Ajax原生编写_AJAX相关

一提到异步交互大家就会说ajax,仿佛ajax这个技术已经成为了异步交互的代名词.那下面将研究ajax的核心对象! 利用ajax实现异步交互无非4步: 1.创建ajax核心对象 2.与服务器建立连接 ...

Google将增加搜索隐私不再永久保留完整IP

Google决定变更数据保存作法,未来所保留的数据将更难辨认出哪些计算机做过哪些搜索. Google的服务器原本会自动记录所有网友所进行的搜索信息,所保留下来的数据包括:网友搜索过哪些关键词. ...

三星手机SCH-I929如何设置定时发送信息？

1.在待机界面下,点击[信息]图标. 2.点击右上角的[新建信息]图标. 3.点击[输入收件人]栏并输入联系人,点击[以输入信息]框并编辑要发送的信息内容. 4.点击[ ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.021 s.