java-关于自然语言中Trie树修改版 请大家帮我填个注释吧 尤其是treeset

问题描述

关于自然语言中Trie树修改版 请大家帮我填个注释吧 尤其是treeset
 package MyTrie;
import java.util.TreeSet;

public class MyTrieUnit implements Comparable {
    int ch; // 某字符的ASCII码值
    int val; // 标记是否为词的最后一位,并记录词对应的编号
    TreeSet<MyTrieUnit> sons;

    public MyTrieUnit(int v) {
        ch = v;
        val = 0;
        sons = new TreeSet<MyTrieUnit>();
    }

    public int compareTo(Object arg0) {
        MyTrieUnit e = (MyTrieUnit) arg0;
        return ch - e.ch;
    }

    public boolean equals(MyTrieUnit e) {
        return ch == e.getCh();
    }

    public MyTrieUnit findChar(int v) {
        MyTrieUnit ret = sons.floor(new MyTrieUnit(v));

        if( ret == null ) return null;
        if (ret.getCh() == v)
            return ret;
        else
            return null;
    }

    /**
     * 向其中添加一个字
     */
    public void add(MyTrieUnit v) {
        sons.add(v);
    }

    public void setV(int v) {
        val = v;
    }

    public int getCh() {
        return ch;
    }

    public int getVal() {
        return val;
    }
}

解决方案

http://www.52nlp.cn/

时间: 2024-10-31 02:43:44

java-关于自然语言中Trie树修改版 请大家帮我填个注释吧 尤其是treeset的相关文章

Java中实现双数组Trie树实例_java

传统的Trie实现简单,但是占用的空间实在是难以接受,特别是当字符集不仅限于英文26个字符的时候,爆炸起来的空间根本无法接受. 双数组Trie就是优化了空间的Trie树,原理本文就不讲了,请参考An Efficient Implementation of Trie Structures,本程序的编写也是参考这篇论文的. 关于几点论文没有提及的细节和与论文不一一致的实现: 1.对于插入字符串,如果有一个字符串是另一个字符串的子串的话,我是将结束符也作为一条边,产生一个新的结点,这个结点新节点的Ba

Hash树(散列树)和Trie树(字典树、前缀树)

1.Hash树 理想的情况是希望不经过任何比较,一次存取便能得到所查的记录, 那就必须在记的存储位置和它的关键字之间建立一个确定的对应关系f,使每个关键字和一个唯一的存储位置相对应.因而在查找时,只要根据这个对应关系f找到 给定值K的像f(K).由此,不需要进行比较便可直接取得所查记录.在此,我们称这个对应关系为哈希(Hash)函数,按这个思想建立的表为哈希表. 在哈希表中对于不同的关键字可能得到同一哈希地址,这种现象称做冲突.在一般情况下,冲突只能尽可能地减少,而不能完全避免.因为哈希函数是从

Android 仿美团网,大众点评购买框悬浮效果之修改版

如果快速滑动界面,显示悬浮框的时候会出现一卡的现象,有些朋友说有时候会出现两个布局的情况,特别是对ScrollView滚动的Y值得监听,我还使用了Handler来获取,还有朋友给我介绍了Scrolling Tricks这个东西,我下载试了下,确实美团网,大众点评的购买框用的是这种效果,但是Scrolling Tricks只能在API11以上使用,这个有点小悲剧,然后我做了下修改,并将实现思路分享给大家,实现起来很简单 首先还是要先对ScrollView进行滚动监听,直接在onScrollChan

Java实现哈夫曼树的构造

哈夫曼树的内容这里不作解释,请自己搜索.下面给出哈夫曼树构造过程的 Java 实现. 结点类: 1./** 2. * 二叉树节点 3. */ 4.public class Node implements Comparable { 5. 6. private int value; 7. 8. private Node leftChild; 9. 10. private Node rightChild; 11. 12. public Node(int value) { 13. this.value

从Trie树(字典树)谈到后缀树(10.28修订)

作者:July.yansha. 出处:http://blog.csdn.net/v_JULY_v .  引言     常关注本blog的读者朋友想必看过此篇文章:从B树.B+树.B*树谈到R 树,这次,咱们来讲另外两种树:Tire树与后缀树.不过,在此之前,先来看两个问题.     第一个问题: 一个文本文件,大约有一万行,每行一个词,要求统计出其中最频繁出现的前10个词,请给出思想,给出时间复杂度分析.     之前在此文:海量数据处理面试题集锦与Bit-map详解中给出的参考答案:用trie

字典树(Trie树)的实现及应用

一.字典树的概念 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树. 与二叉查找树不同,Trie树的键不是直接保存在节点中,而是由节点在树中的位置决定.一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串.一般情况下,不是所有的节点都有对应的值,只有叶子节点和部分内部节点所对应的键才有相关的值. Trie树优点是最大限度地减少无谓的字符串比较,查询效率比较高.核心思想是空间换时

关于Trie树的模板

Trie树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种.典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高. ---百度百科 具体给出代码,这也是根据大牛们的一些代码整的,,还是太渣了..... #include <iostream> #include <cstdio> #include <cstring&g

trie树

最近接触到数据处理这一块,也就自然接触到了Trie树.它又称字典树,是一种树形结构,是一种哈希树的变种.典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索系统用于文本词频统计,与比哈希表比查询效率要高. 主要思想 它的主要思想是空间换时间,利用字符串的公共前缀来降低查询时间的开销. 作为一种树型结构,利用不同的节点来保存某一信息的一位信息,该信息的的最大位数决定了tire数的深度.为了能表示所有可能的信息,它的每个节点的出度的最大值就是信息所包含的不同字符的最多个数.在每个

产品经理回应手机QQ头像全亮:修改版将区分状态

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   腾讯科技讯 5月15日消息,近日,QQ全新手机版的发布引发了众多用户的吐槽,业内人士和行业媒体也纷纷关注.腾讯QQ手机版团队在官微上已经声明将在两周内出修改版,尽管已经有业内消息称修改版将区分在线离线状态,但是关于"联系人"中好友头像全亮这个设计,业内还是有不少的声音. 5月15日,腾讯QQ一名产品经理做出了如下回应: 首先得解释,2013版