如何使用java找出段首句和段尾句

问题描述

如何使用java找出段首句和段尾句

最近要实现一个自动摘要算法,需要找出段首句和段尾句,并给他们赋予权重,所以如何找出段首句和段尾句?(ps:从网上爬下来的文档分段不是很分明,但是两个句子之间空有有四个字节)

解决方案

句子之间一般是通过标点符号,或者html的p span br之类分割的,你要找到规律。

时间: 2024-09-09 22:56:09

如何使用java找出段首句和段尾句的相关文章

java-如何用Java找出网页Email?

问题描述 如何用Java找出网页Email? 对于这样的处理当然用正则表达式,但是有的时候对我要查找的网页分成了很多页.例如http://tieba.baidu.com/p/4032901264(把显示出来的超链接当作Email吧,举例子没找到合适的). 解决方案 分了很多页,先找到下一页的链接,然后循环获取,直到找不到再下一页为止. 解决方案二: java正则表达式匹配网页email(email抓取)简单的从网页获取Email的Java小程序JAVA语言用正则表达式抓取网页中的email

Java实现从字符串中找出数字字符串的方法小结_java

本文实例总结了Java实现从字符串中找出数字字符串的方法.分享给大家供大家参考,具体如下: int start = 0; String numStr = null; for (int j = 0; j < valuesStr.length() - 1; j++) { if (Character.isDigit(valuesStr.charAt(j)) == false && Character.isDigit(valuesStr.charAt(j + 1)) == true) { s

JavaScript实现找出字符串中第一个不重复的字符_javascript技巧

此算法仅供参考,小菜基本不懂高深的算法,只能用最朴实的思想去表达. //找出字符串中第一个不重复的字符 // firstUniqueChar("vdctdvc"); --> t function firstUniqueChar(str){ var str = str || "", i = 0, k = "", _char = "", charMap = {}, result = {name: "",i

找出导致java.lang.OutOfMemoryError: Java heap space问题的数据

问题描述 引起java.lang.OutOfMemoryError:Javaheapspace异常,可能是由JAVA的堆栈设置太小的原因,在网上查了下都是调整jvm大小的,但这个方法治标不治本呀!!!!,当数据增大是依然会报溢出错误,总不至于再把jvm调大吧.有没有办法找到导致溢出的数据,之前听同事说有办法找到,但是不知道怎么找的,求大神指导 解决方案 解决方案二:upup解决方案三:错误是在tomcat启动的时候报的解决方案四:是不是你程序代码的问题呢?解决方案五:引用3楼rui888的回复:

JAVA函数实现任意给定一组数, 找出任意数相加之后的结果为35

用JAVA写一个函数.功能如下:任意给定一组数,例如{12,60,-8,99,15,35,17,18},找出任意数相加之后的结果为35(任意设定)的情况. 可以递归算法来解: package test1; import java.util.Arrays; public class demo { public static void main(String[] args) { String str = "12,60,-8,99,15,35,17,18,8,10,11,12"; int s

java 集合问题找出两个集合中相同的元素并打印出来

问题描述 java 集合问题找出两个集合中相同的元素并打印出来 把1-100 数随机放入到 数组长度为[97] 并且这些元素不能重复,找出未输入进数组的数! 解决方案 package set; import java.util.HashSet; /* 作业: 把1-100 数随机不重复放入到 数组[97] ,找出未存入的数! */ public class Test5 { public static void main(String[] args) { // 1.创建 一个 HashSet集合,

sparkStreaming 找出一段时间内第一次和最后一次出现的字母

问题描述 自己做了个随机输出字母的数据流,想类似于sparkStreaming的窗口,找出在一段时间内第一次和最后一次出现的单词是什么 解决方案 解决方案二:mark,itisainteresttopictolearnspark,learnfromyou

数据结构 算法-如何用java中串的操作方法找出两个字符串中所有共同的字符

问题描述 如何用java中串的操作方法找出两个字符串中所有共同的字符 通过实现对串的基本操作的算法设计,运用模式匹配算法KMP和Brute-Force,展出两个字符串中所有共同的字符,判断一个字符串是否为E-mail地址

冒泡排序-Java比较多个日期从中找出最早最晚时间

问题描述 Java比较多个日期从中找出最早最晚时间 1 a 2013-04-011 a 2013-04-081 a 2013-04-282 a 2013-04-082 a 2013-11-111 a 2013-04-01 2013-04-28 32 a 2013-04-08 2013-11-11 2求代码,实现以前两列为唯一,比较多个日期从中找出最早最晚时间,并统计出现次数 解决方案 http://club.excelhome.net/thread-885424-1-1.html 解决方案二: