Java正则表达式(三)、代码量统计工具(统计java源文件中注释、代码、空白行数量)

       比如想统计一个Java程序员一天写代码的工作量(如:有效代码多少行、空行多少、注释多少行等),这个小工具也许能做为一个参考的依据。

    思路:因为每个java源文件的内容基本包括java语句、空白行、注释三部份组成(不包括注解),所以要统计某个文件这三部份的内容各占多少时,只需写三个匹配这几部份内容的正则表达式即可。然后通过IO流读取文件中的每一行,并根据正则匹配的结果,累加每部份匹配的数量即可。

    注释行:单行注释(//)、多行注释、文档注释。正则:((//)|(/\\*+)|((^\\s)*\\*)|((^\\s)*\\*+/))+

    空白行:一行内只有空格、\t、\n等非可视字符表示空白行。正则:^\\s*$

    代码行:以分号“;“结束为一行有效的代码。正则:(?!import|package).+;\\s*(((//)|(/\\*+)).*)*

    实现方式:

        1、用户在控制台输入要统计的java文件路径或目录

        2、根据路径创建一个File对象,判断文件是否有效,并给出提示。最后将文件和IO流绑定

        3、循环读取文件中的某一行,并根据正则匹配的结果累记每部份匹配的数量

完整代码如下:

package regex;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileFilter;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.Scanner;
import java.util.regex.Pattern;

/**
 * 代码统计工具
 * 统计某个java源文件或某个目录中所有java源文件中注释、空白行、代码行各占多少行
 * 注释:包括单行注释(//)、多行注释、文档注释
 * 空白行:一行内没有任何内容的表示空白行
 * 代码行:以分号“;”结束的一条语句,可以统计为一行有效代码
 */
public class CodeStatDemo {

	// 记录注释行数
	static long annotationLine = 0;

	// 记录空白行数
	static long blankLine = 0;

	// 记录有效代码的行数
	static long codeLine = 0;

	// 代码总行数
	static long totalLine = 0;

	// 文件总数
	static long fileCount = 0;

	public static void main(String[] args) throws FileNotFoundException  {
		System.out.println("请输入要统计代码量的java文件或java目录:");
		Scanner in = new Scanner(System.in);
		String filePath = in.nextLine();

		File file = new File(filePath);
		// 根据用户输入的文件名和目录执行代码量统计
		codeStat(file);

		System.out.println("----------统计结果---------");
		System.out.println("文件数量:" + fileCount + "个");
		System.out.println(file + "文件/目录总行数:" + totalLine);
		System.out.println("代码行数:" + codeLine);
		System.out.println("注释行数:" + annotationLine);
		System.out.println("空白行数:" + blankLine);
		long otherLine = totalLine - (codeLine + annotationLine + blankLine);
		System.out.println("其它行数:" + otherLine);

	}

	private static void codeStat(File file) throws FileNotFoundException {
		if (file == null || !file.exists())
			throw new FileNotFoundException(file + ",文件不存在!");

		fileCount ++;	// 文件数累加

		if (file.isDirectory()) {
			File[] files = file.listFiles(new FileFilter() {

				@Override
				public boolean accept(File pathname) {
					return pathname.getName().endsWith(".java") || pathname.isDirectory();
				}
			});

			for (File target : files) {
				codeStat(target);
			}
		} else {
			BufferedReader bufr = null;
			try {
				// 将指定路径的文件与字符流绑定
				bufr = new BufferedReader(new InputStreamReader(new FileInputStream(file)));
			} catch (FileNotFoundException e) {
				throw new FileNotFoundException(file + ",文件不存在!" + e);
			}

			// 定义匹配每一行的正则匹配器
			Pattern annotationLinePattern = Pattern.compile("((//)|(/\\*+)|((^\\s)*\\*)|((^\\s)*\\*+/))+",
					Pattern.MULTILINE + Pattern.DOTALL);	// 注释匹配器(匹配单行、多行、文档注释)

			Pattern blankLinePattern = Pattern.compile("^\\s*$");	// 空白行匹配器(匹配回车、tab键、空格)

			Pattern codeLinePattern = Pattern.compile("(?!import|package).+;\\s*(((//)|(/\\*+)).*)*",
					Pattern.MULTILINE + Pattern.DOTALL); // 代码行匹配器(以分号结束为一行有效语句,但不包括import和package语句)

			// 遍历文件中的每一行,并根据正则匹配的结果记录每一行匹配的结果
			String line = null;
			try {
				while((line = bufr.readLine()) != null) {
					if (annotationLinePattern.matcher(line).find()) {
						annotationLine ++;
					}

					if (blankLinePattern.matcher(line).find()) {
						blankLine ++;
					}

					if (codeLinePattern.matcher(line).matches()) {
						codeLine ++;
					} 

					totalLine ++;
				}

			} catch (IOException e) {
				throw new RuntimeException("读取文件失败!" + e);
			} finally {
				try {
					bufr.close();	// 关闭文件输入流并释放系统资源
				} catch (IOException e) {
					throw new RuntimeException("关闭文件输入流失败!");
				}
			}
		}
	}
}

测试结果:

时间: 2024-09-16 01:40:53

Java正则表达式(三)、代码量统计工具(统计java源文件中注释、代码、空白行数量)的相关文章

java正则表达式表单验证类工具类(验证邮箱、手机号码、qq号码等)_java

java使用正则表达式进行表单验证工具类,可以验证邮箱.手机号码.qq号码等 复制代码 代码如下: package util; import java.util.regex.Matcher;import java.util.regex.Pattern; /** * 使用正则表达式进行表单验证 *  */ public class RegexValidateUtil {    static boolean flag = false;    static String regex = ""

常用的网站流量统计工具比较

比较|流量|统计 最近试用了几个流量统计工具,粗略的比较了一下,不当之处望指正: 163流量统计 :(没全面测试) 优点:几乎没有看到广告,页面干净 缺点:1.中规中矩,没有出彩的地方 2.安装后,网页显示速度有所降低,浏览器告警"阻挡cookie发送" 51Yes : 优点:1.客户地理位置统计用地图显示,并在地图用不同颜色标记各省的客户比例 2.功能较全面 缺点:广告超多 太极链 :(没全面测试) 优点:广告少 缺点:1.只对PV访问量大于5000的用户开通历史统计功能 2.统计响

几个常用的网站流量统计工具比较

最近试用了几个流量统计工具,粗略的比较了一下,不当之处望指正: 163流量统计 :(没全面测试) 优点:几乎没有看到广告,页面干净 缺点:1.中规中矩,没有出彩的地方 2.安装后,网页显示速度有所降低,浏览器告警"阻挡cookie发送" 51Yes : 优点:1.客户地理位置统计用地图显示,并在地图用不同颜色标记各省的客户比例 2.功能较全面 缺点:广告超多 太极链 :(没全面测试) 优点:广告少 缺点:1.只对PV访问量大于5000的用户开通历史统计功能 2.统计响应速度偏慢 Goo

java正则表达式详细入门级别回答

问题描述 java正则表达式详细入门级别回答 初次学习java,希望大家能给一个较为通俗易懂的回答,解释下正则表达式的基本情况还有用法. 解决方案 Java中的正则表达式(详细)JAVA正则表达式(详细)java 正则表达式 (非常详细) 解决方案二: 正则表达式是一种匹配规则-在不同的语言中有不同的实现

Java 批量删除html中注释内容的方法_java

其实删除html文本中的注释有很多方法,这里就自己随便写了一个处理方法,权当笔记,有需要的同学可以参考. html文本的注释有几个特点: 1. 成对出现,有开始就一定有结束. 2. 注释标签没有嵌套,注释开始标签(以下称为 <!--)下一个一定是其对应的结束标签(以下称为 -->). 3. 一行中可能有多个注释标签对儿. 4. 注释也可以换行. 大致有以下几种情况: 复制代码 代码如下: <html>  <!--This is a head-->  <head&g

Shell脚本实现的基于SVN的代码提交量统计工具

  这篇文章主要介绍了Shell脚本实现的基于SVN的代码提交量统计工具,本文直接给出实现脚本代码,需要的朋友可以参考下 最近没啥事,就用bash写了一个基于svn的代码统计小工具. 可以指定统计的目录,默认递归统计子目录. 目前还没有屏蔽指定目录的功能.哈 代码比较粗糙.不过先晒出来. ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 3

Shell脚本实现的基于SVN的代码提交量统计工具_linux shell

最近没啥事,就用bash写了一个基于svn的代码统计小工具. 可以指定统计的目录,默认递归统计子目录. 目前还没有屏蔽指定目录的功能.哈 代码比较粗糙.不过先晒出来. #!/bin/bash - #""""""""""""""""""""""""""

hta应用—代码统计工具

统计 作者的blog: blog.never-online.net "Never Modules"-NCC(never code counter) tools-代码统计工具V1.01统计js,asp,aspx,cs,html,xml等 把源代码存为(hta)文件,因为hta文件没有状态栏,所以我这里建议大家存为html文件,这样可以在状态栏下看到NCC扫描的进度,我这里把NCC的maxloop设置为3000,所以文件统计到3000的时候,会自动终止,以防文件夹中文件太多造成运行的负担.

Python实现代码统计工具(终极篇)_python

本文对于先前系列文章中实现的C/Python代码统计工具(CPLineCounter),通过C扩展接口重写核心算法加以优化,并与网上常见的统计工具做对比.实测表明,CPLineCounter在统计精度和性能方面均优于其他同类统计工具.以千万行代码为例评测性能,CPLineCounter在Cpython和Pypy环境下运行时,比国外统计工具cloc1.64分别快14.5倍和29倍,比国内SourceCounter3.4分别快1.8倍和3.6倍. 运行测试环境本文基于Windows系统平台,运行和测