Python实现统计单词出现的个数

   这篇文章主要介绍了Python实现统计单词出现的个数,本文给出了实现代码以及使用方法,需要的朋友可以参考下

  最近在看python脚本语言,脚本语言是一种解释性的语言,不需要编译,可以直接用,由解释器来负责解释。python语言很强大,而且写起来很简洁。下面的一个例子就是用python统计单词出现的个数。

  ?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

import sys
import string
#import collections
 
if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}:
print("usage: uniqueword filename_1 filename_2 ... filename_n")
sys.exit()
else:
words = {}
# words = collections.defaultdict(int)
strip = string.whitespace + string.punctuation + string.digits + ""'"
for filename in sys.argv[1:]:
for line in open(filename):
for word in line.split():
word = word.strip(strip)
if len(word) >= 2:
words[word] = words.get(word, 0) + 1
# words[word] += 1
for word in sorted(words):
print("'{0}' occurs {1} times".format(word,words[word]))

  假设文件名是 uniqueword.py,在命令行下输入: uniqueword.py filename_1 filename_2 ... filename_n中单词出现的次数可以被统计出来。

  第四行和第五行判断是否有输入参数,如果输入参数为空或者为-h, -help,则输出帮助信息。

  从第七行到第14行是核心部分,逐一打开参数中指定的文件,并读取每一行,再用字符串的split方法把读取的行抽取出一个一个的单词,但单词长度大于2的时候,把此单词加入到字典words中。 其中words.get(word, 0)的意思是取出key等于word的value,如果key为空,则把value置为默认值0. 最后打印出结果。

时间: 2024-12-23 18:57:36

Python实现统计单词出现的个数的相关文章

Python实现统计英文单词个数及字符串分割代码

  这篇文章主要介绍了Python实现统计英文单词个数及字符串分割方法,本文分别给出代码实例,需要的朋友可以参考下 字符串分割 代码如下: str="a|and|hello|||ab" alist = str.split('|') print alist 结果 代码如下: str="a hello{这里换成5个空格}world{这里换成3个空格}" alist=str.split(' ') print alist 统计英文单词的个数的python代码 代码如下: #

开发可统计单词个数的Android驱动程序(下)

八. 指定回调函数 本节讲的内容十分关键.不管Linux驱动程序的功能多么复杂还是多么"酷",都必须允许用户空间的应用程序与内核空间的驱动程序进行交互才有意义.而最 常用的交互方式就是读写设备文件.通过file_operations.read和file_operations.write成员变量可以分别指定读写 设备文件要调用的回调函数指针. 在本节将为word_count.c添加两个函数:word_count_read和word_count_write.这两个函数分别处理从设备文件读

开发可统计单词个数的Android驱动程序(中)

五.指定与驱动相关的信息 虽然指定这些信息不是必须的,但一个完整的Linux驱动程序都会指定这些与驱动相关的信息.一般需要为Linux驱动程序指定如下信息. 1. 模块作者:使用MODULE_AUTHOR宏指定. 2. 模块描述:使用MODULE_DESCRIPTION宏指定. 3. 模块别名:使用MODULE_ALIAS宏指定. 4. 开源协议:使用MODULE_LICENSE宏指定. 除了这些信息外,Linux驱动模块自己还会包含一些信息.读者可以执行下面的命令查看word_count.ko

Python开发的单词频率统计工具wordsworth使用方法_python

使用方法: python wordsworth --filename textfile.txt python wordsworth -f textfile.txt 分析结果: 附上github项目地址:https://github.com/autonomoid/wordsworth 以上是小编为您精心准备的的内容,在的博客.问答.公众号.人物.课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索python wordsworth python统计单词频率.python 统计字母频率.py

《Android深度探索(卷1):HAL与驱动开发》——6.3节第一个Linux驱动:统计单词个数

6.3 第一个Linux驱动:统计单词个数Android深度探索(卷1):HAL与驱动开发源程序目录:<光盘根目录>/sources/word_count本节将给出我们的第1个Linux驱动的例子.这个驱动程序并没有访问硬件,而是利用设备文件作为介质与应用程序进行交互.应用程序通过向设备文件传递一个由空格分隔的字符串(每一个被空格隔开的子字符串称为一个单词),然后从设备文件读出来的是该字符串包含的单词数.本例的驱动程序使用C语言实现,源代码文件路径如下. 6.3.1 编写Linux驱动程序前的

开发可统计单词个数的Android驱动程序(3)

开发可统计单词个数的Android驱动程序(1) 五.指定与驱动相关的信息 虽然指定这些信息不是必须的,但一个完整的Linux驱动程序都会指定这些与驱动相关的信息.一般需要为Linux驱动程序指定如下信息. 1. 模块作者:使用MODULE_AUTHOR宏指定. 2. 模块描述:使用MODULE_DESCRIPTION宏指定. 3. 模块别名:使用MODULE_ALIAS宏指定. 4. 开源协议:使用MODULE_LICENSE宏指定. 除了这些信息外,Linux驱动模块自己还会包含一些信息.读

python 远程统计文件代码分享

  享一个Python获取远程文件大小的函数代码,简单实用,是学习Python编程的基础实例. python 远程统计文件 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 #!/usr/bin/python #encoding=utf-8 import time import os import parami

c++中如何把一个十进制整数转换成二进制然后统计其中1的个数

问题描述 c++中如何把一个十进制整数转换成二进制然后统计其中1的个数 c++中如何把一个十进制整数转换成二进制然后统计其中1的个数 解决方案 做个循环,每次除以2,将余数输出或保存,可转换为二进制,,至于统计,每次除法所得余数为1,使得计数器加1 解决方案二: itoa转为二进制字符串,自己遍历统计1的个数 解决方案三: int x = 123; int count = 0; while (x > 0) { count += x % 2; x /= 2; } 解决方案四: http://cod

分享python数据统计的一些小技巧_python

最近在用python做数据统计,这里总结了一些最近使用时查找和总结的一些小技巧,希望能帮助在做这方面时的一些童鞋.有些技巧是很平常的用法,平时我们没有注意,但是在特定场景,这些小方法还是能带来很大的帮助. 1.在字典中将键映射到多个值上面 {'b': [4, 5, 6], 'a': [1, 2, 3]} 有时候我们在统计相同key值的时候,希望把所有相同key的条目添加到以key为键的一个字典中,然后再进行各种操作,这时候我们就可以使用下面的代码进行操作: from collections im