关于手机等品牌型号搜索与采集的中文分词分离

很久以前,写过一个手机的搜索查询,这里要涉及到手机类型和型号的分离。

很久之后前,有人问起这个问题,于是,写点说明就把这函数的草稿发布了,并写下了这一些说明。

函数说明,如搜索输入:诺基亚N95,将被拆分成品牌:诺基亚 型号:N95

对于手机数据采集,也可以用这函数分离出品牌和型号。

SetSearchKey("诺基亚N95",out 诺基亚,out N95);

 

函数代码如下:

 

protected void SetSearchKey(string keyword, out string goodsName, out string goodsModel)
        {
            keyword = keyword.ToLower().Trim();
            if (keyword.Contains(" "))//带空格,分离
            {
                goodsName = keyword.Split(' ')[0].Trim();
                goodsModel = keyword.Split(' ')[1].Trim();
            }
            else if (Regex.Match(keyword, @"^[\u4E00-\u9FA5]+[\w\d]+").Success)//以中文开头,包含英文,分离
            {
                goodsName = Regex.Match(keyword, @"^([\u4E00-\u9FA5]+)[\w\d]+").Groups[1].Value;
                goodsModel = keyword.Replace(goodsName, string.Empty);
            }
            else
            {
                string[] keys = new string[] { "nec", "lg", "vk", "cect" };
                for (int i = 0; i < keys.Length; i++)
                {
                    if (keyword.IndexOf(keys[i]) == 0)
                    {
                        goodsName = keys[i];
                        goodsModel = goodsModel = keyword.Replace(goodsName, string.Empty);
                        return;
                    }
                }
                goodsName = keyword;
                goodsModel = keyword;

            }
        }

 

 

时间: 2024-10-31 02:44:22

关于手机等品牌型号搜索与采集的中文分词分离的相关文章

asp.net开发wap程序必备:识别来访手机品牌型号

我们在开发wap应用程序需要有识别来访手机品牌型号的功能,这样才可以更好的为用户提供更好的个性化服务,比如图片类型.屏幕尺寸.铃声类型等.      http协议中,User-Agent这个标头指示的浏览器信息,文章最后附加了常见的手机User-Agent.      每个厂家,甚至一个厂家多个品牌的User-Agent都没有一个统一命名标准,所以处理起来相当麻烦---不停的if.比如判断某个手机的品牌     If Request.UserAgent.ToUpper.StartsWith("M

360搜索回归360母品牌 安全搜索才“靠谱”

好搜切换回360搜索,是360公司对安全概念不断扩散和延伸的重要举措,也意味着360搜索将继续依托360母品牌的基础,在安全.可信赖等方面,继续形成差异化优势.     名字虽变价值观始终如一 根据360搜索的一份调查显示,从360搜索,到一年前推出的"好搜",名字虽变,用户构成基本没有发生什么变化,基本都是360的忠实用户."好搜"名字推出一年以来,很多用户.客户和合作伙伴,仍然一直习惯于使用"360搜索"这个名称,或者在好搜后面加个注释&qu

搜索成第二大手机应用 非文字搜索形式渐成趋势

移动搜索呈现出一派欣欣向荣的局面.据中国互联网信息中心(CNNIC)近日发布的<2014中国网民搜索行为研究报告>显示,上半年,我国手机搜索引擎用户规模达4.0583亿人,截至今年第二季度已经超过手机新闻,成为除手机即时通信以外的第二大手机应用. 移动搜索不断渗透到用户日常生活,仅文字搜索早已不能满足用户的诉求,图片.语音.人像搜索都将成为趋势.搜索企业要在新趋势下敢于探索,抓住行业发展方向,不断提升用户体验,唯有这样,才能越走越远. 移动搜索成第二大手机应用 查看新闻.查找地理位置.搜索最新

好照片桌面版支持RAW格式相机品牌型号对照表

好照片桌面版支持RAW格式相机品牌型号对照表 相机品牌 相机系列 相机型号 佳能 Canon EOS 1D 1DS 1D Mark II 1D Mark II N 1D Mark III 1D Mark IV 1Ds Mark II 1Ds Mark III 5D 5D Mark II 7D 10D 20D 30D 40D 50D 60D 300D 350D 400D 450D 500D 550D 650D 1000D D2000C PowerShot G1 G2 G3 G5 G6 G7 G9

从零到六亿的用户增长看360手机助手品牌变迁

日前,http://www.aliyun.com/zixun/aggregation/1983.html">360手机助手启动了3.0身边版的内测,并推出社交分发业务模式.这是360手机助手上线三年来最大的变革.社交分发模式包括好友分发.位置分发.当面分发和个性分发等多个功能,借通讯录好友.地理位置等渠道进行应用分发.此举将颠覆目前的应用分发模式,并已引发应用宝等同行的跟进. 据介绍,位置分发可查看附近用户所使用的软件和游戏:好友分发则是在用户双方都在360手机助手认证确认开启后,可查看通

中移动对品牌整合加快 推手机阅读品牌&quot;和阅读&quot;

硅谷网讯 继4G品牌"和"诞生后,中国移动对品牌的整合继续加快.1月10日,其推出http://www.aliyun.com/zixun/aggregation/10264.html">手机阅读品牌--"和阅读",计划投入2亿元进行WAP以及客户端产品推广的补贴. 中国移动手机阅读基地由浙江移动运营,据浙江移动总经理郑杰介绍, 3721.html">2014年,中国移动"和阅读"业务计划拿出5000万元做数字内容发

中国GSM手机走向品牌化、国际化

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;       沉寂了两个多月的中国GSM手机市场进入七月呈爆炸性回暖行情,照目前的出货走势分析,七月大陆功能手机出货很可能超越今年最火的三月,由于三月日本地震影响很多公司为备元器件缺货加大了库存,造成四至七月中国功能手机市场的大萧条,当然萧条的另外一个原因在于本来五月六月也是历来的年度淡季,只不过与往年相比今年格外淡了些. 七月的复苏能否在八月延续目前尚不确定,因为今

SEO搜索中文分词算法原理实战教程

SEO搜索中文分词算法原理实战教程,如果一个人想成为一个合格的SEO人员,那么搜索引擎分词思维是必须掌握的,因为只有掌握了分词思维,你才可以做出搜索引擎喜欢,而且用户也喜欢的网页,虽然在梦想之旅视频教程中有和大家分享过搜索引擎中文分词原理,但没有完全的,系统的用文字版本和图片版本和大家分享,那么顾芳源就带大家如何正确学习SEO搜索分词思维吧. 搜索引擎中文分词原理 首先我们要知道搜索引擎工作原理是把每个网页的内容按词来录入到数据库,比如你的文章标题是:梦想SEO实战培训提供免费SEO教程,那么搜

Lucene 3.6.2入门(14) SolrJ操作索引和搜索文档以及整合中文分词

package com.jadyer.solrj; import java.util.ArrayList; import java.util.List; import org.apache.solr.client.solrj.SolrQuery; import org.apache.solr.client.solrj.SolrServer; import org.apache.solr.client.solrj.SolrServerException; import org.apache.sol