如何提取公司真实名称

问题描述

就是我有一份公司信息数据，我要提取出每个公司名称并去重。现在的问题是：例1:：“江西省新余市某某农机有限公司”和“新余市晶丰农业机械制造有限公司”其实是同一公司例2：“江西赣州第一建筑有限公司”和“江西抚州第一建筑有限公司”，去掉前面地区和后面有限公司后都是“第一建筑”，可这是俩公司啊像碰到这类情况如何去重

解决方案

这属于机器学习，忒智能了点，不过倒是可以写个程序，把所有的名字相似的抓出来，人工核对一下。把两个串拆开，一个个字对比，如果有超过一半的字符一样，那么判断相似，然后存起来
解决方案二：
Entity Recognation 问题。典型人工智能问题。要求100%准确的话，无解。有些问题只能人工判断，甚至人都判断不了。不要求100%准确的话，可以通过各种方法来实现。先分词，计算相似性，聚类。或者写基于统计的机器学习模块，需要人工训练。
解决方案三：
如果名字相同，那么应该再设置一个字段作为代号，用名字和代号来组合查询，这样就可以避免重复的数据，如果不能新增代号字段，个人认为可以改变去重条件，不然无法区分同名的数据。
解决方案四：
这个不同名属于同一公司只有提前定制规则了，定制同一公司多个名字的规范不在这个规范里的都认为是同一公司，这个没别的办法

时间： 2024-09-13 02:10:54

如何提取公司真实名称的相关文章

浪潮公司中文名称获注册处通过

8月17日下午消息,浪潮国际今日在港交所发布公告称,开曼群岛公司注册处已批准公司使用中文名称"浪潮国际有限公司". 公告称,公司中文名称修改不会影响现有股东任何权利.新发行股票将同时印有中英文名称"Inspur International Limited浪潮国际有限公司".

久邦数码总裁张向东宣布正式启用公司品牌名称久邦数码

12月24日上午消息,久邦数码总裁张向东宣布正式启用公司品牌名称"久邦数码".此前久邦数码一直用旗下产品线"3G门户"指代公司. 除启用"久邦数码"集团品牌名称外,久邦数码旗下移动阅读业务也在本次品牌升级中正式以"久邦文学"名称亮相,而3G门户网将继续作为久邦数码的国内产品线品牌使用. 据官网资料显示,3G门户月独立访问用户4400万.GO桌面系列应用作为久邦数码成功在海外拓展的业务,总用户量已达3.25亿,月活跃用户8700

PE作参考更要看公司真实价值

我们老说PE怎么好,投资怎么牛,其实是犯了很多的错误.我在这儿说一下犯的错误.其实错误就是99年,2000年http://www.aliyun.com/zixun/aggregation/12847.html">互联网投资的高潮那儿.第一个是技术太高,当时的企业,具体数字我就不说了,当时谈是100,后来是200,最后成交价是400,但是市场比这个涨的还快,所以当时按照市场的估值,觉得还是便宜,最后就进去了.最后这个企业经过5.6年就成功地上市了,我们原来想象是赚10倍的公司,最后赚了3倍,

网易29日举行特别股东大会更改公司英文名称

新浪科技讯北京时间3月7日晚间消息,网易(Nasdaq:NTES)今日宣布,将于北京时间2012年3月29日上午10点举行特别股东大会.此次大会旨在对一项特别提议进行投票,即将公司英文名称从"NetEase.com, Inc."更改为"NetEase, Inc.". 公司及董事会认为,该更名提议能够更准确地体现网易的业务运营.如今,网易的业务已涵盖娱乐.社区.电子商务和其他服务. 此次特别股东大会将在网易办公楼召开,具体地址为:北京市海淀区中关村东路1号清华科技园

用STRACE解决公司真实故障一例

这是相关分析文档.为了职业操守,已修改相关公司敏感信息~~~ ~~~~~~~~~~~~~~~~~~~~~~~~ 关于论坛每五分钟左右,会有warning.html跳转出现的原因调查 (warning.html)页面显示的即服务器正繁忙,请稍后重试最近两三周,收到客服及公司同事反映,打开BBS时,会时不时出现warning.html页面的提示跳转. 本周开始正规此问题,但调查一直没有明显头绪.数据库,连接数,触发器,SQL语句抓取,PHP-FPM配置,等等都彻查了一次. 最后,用

请听一个故事------&gt;你真的认为iPhone只是一部手机？苹果惊天秘密!!

在网上看到的一篇小说,感觉有点意思,转载过来大家一起围观下,作者很幽默很风趣. 导读:iPhone的隐藏功能!Jobs的军方身份!图灵服毒自杀的传奇故事!中兴华为的神秘背景! 你真的认为iPhone只是一部手机么?告诉你iPhone中的惊天秘密. 闲言不表,直奔主题.我是一个程序员,上周参加了一个开源软件交流大会,其实会上并没有听到什么新鲜的东西.但是在会中,偶然间听到了一个关于iphone的秘密,却着实令我震惊了,事情具体是这样的,听我慢慢道来. 大会是上午9:00点开始,主持人寒暄了一会,就

Excel如何批量提取全部工作表名称公式

在使用公式查询或汇总多工作表数据时经常需要用到整个工作簿所有工作表的名称,下面介绍如何用宏表函数GET.WORKBOOK来提取工作表名称. 提取工作表名称过程: Ctrl+F3调出定义名称对话框,或者点击[公式]-[定义名称]调出定义名称对话框. 在[名称]框里输入一个定义名称(本例输入ShName),方便在工作表中引用.在[引用位置]处输入=GET.WORKBOOK(1),设置完毕后点击[确定]按钮. 双击一个单元格,输入公式:=INDEX(ShName,ROW(A1)),这时就返回了包括

渠道商用假量冒充真实用户：开发者求给条活路

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅创业者很苦鳖的,苦于创意,苦于开发,苦于用户体验. 创业者很苦鳖的,就算把产品做好了,不推广也很难获得用户. 创业者很苦鳖的,遇上无良渠道商,花钱做推广,花时间做换量,可产品还是不见起色. 看看一个同样苦鳖的开发者赵学童鞋的自述吧. 我做数据挖掘技术出身,并从事推广工作三年,App付费推广的作假现象已屡见不鲜, 这次终于长见识了,见过作假的,

关于SEO公司的选择问题元芳你怎么看

选择一家有实力的seo公司对于网络技术不精或很陌生的企业来说是很有必要的.面对众多搜索引擎优化团队,如何才能选择一家适合的有实力的优化公司呢? 很多中小型企业都有网站优化的需求,但是大多苦于找到一家有实力的SEO公司.以下是一些标准可以作为衡量搜索引擎优化公司优劣的基础: 一,搜索引擎公司的主营产品要在搜索引擎里排名靠前. 例如要在百度和谷歌这些搜索引擎上找到他们公司的网站,如果他们的公司还在做竞价排名,很显然这类公司是不可取的.还可以在搜索引擎中搜索公司的名称,从网上的评论中来评价该公司的信誉

猜你喜欢

加快网页访问速度:更新CSS缓存怎么处理

文章简介:HTML中css和js链接中的版本号. 背景在搜索引擎中搜索关键字.htaccess 缓存,你可以搜索到很多关于设置网站文件缓存的教程,通过设置可以将css.js等不太经常更新的文件缓存在 ...

SEO总结:百度K站39天后放出且有排名

年前一站,被百度在1月12时K掉了,site首页都找不到了,之至后还以为会等很久,才会放出来呢,没有想到的是,在本月20号就放出来了. 查看了mytool上的快照记录,前后总共也就是39天的时候,百度 ...

作为个人SEOer该如何谈单(二）

5号我发表过一篇关于seoer谈单的一些经验,自己又想起来很多谈单过程遇到的问题,特此写第二篇关于谈单的文章和广大seoer同行分享.也许是因为地域问题或者其他问题,我发现每个地方的客户对seo理解都 ...

浅谈Try catch finally与using

对于Try catch finally,大家应该都不陌生,您接触的写法可能会是下面的记几种类型: Try catch (您可以匹配多个catch) try { } catch (Exception) ...

js 处理数组重复元素示例代码

数组重复元素如何处理,这是在项目实战中经常遇到的,针对这个问题,下文给出详细解决方法,希望对大家有所帮助代码如下: function doSz{ var kzly==["a&quo ...

电台网站网页配色

网页配色页面分析网站首页使用粉色做背景,这是很温馨.明快的色彩,而稍稍混入黑色或白色,使其看起来略显稳重. 网站解析--首页色彩与版式该电台网站首页的色彩与版式分析如下. 区块分析网站解析-- ...

电脑PDF缩略图不显示该怎么办

方法一: 1.可以使用360安全卫士将系统pdf查看软件卸载干净,并选择安装福昕pdf查看器; 2.安装完成后在大图模式下就可以看到缩略图了. 方法二: 可能有用户是使用Adobe Acrobat ...

迅雷快传申请提高权限

在开通版主权限之后,您可以移动鼠标停放在右上角昵称处查看您目前的积分:将会出现"申请提高权限"文字链=>点击后打开进入申请弹窗=>填写您想申请提升的权限及幅度.提升 ...

支付宝碎屏险有什么用？

碎屏险是什么? 碎屏险是支付宝新推出的一项服务,通俗的说,就是为您的手机屏幕买保险,当手机由于意外摔落,导致屏幕损坏后,支付宝将会为您全额赔偿,会您免费更换全新屏幕. 支付宝碎屏险须知 1.支付宝 ...

电脑USB给智能手机充电是否安全？

在日常生活中,我们可能会遇到这样的问题:用电脑USB给智能手机充电之后,手机的耗电速度似乎比用充电器充电之后要快一些,那么到底是什么原因导致了这样的现象呢? 用电脑给手机充电后不耐用的原因在于,我 ...

eclipse无法启动-本人系统ubuntu 安装eclipse时出现了错误求指教

问题描述本人系统ubuntu 安装eclipse时出现了错误求指教 !SESSION Sat Sep 13 10:54:53 CST 2014 -------------------------- ...

Tomcat设置，输入IP地址，直接访问项目主页

1.cmd 命令看下 80 端口是否被占用 netstat -ano 2.没有被占用的话,将tomcat的端口设成80 配置文件的路径为\pache Software Foundation\Tomc ...

WCF后续之旅(13)：创建一个简单的SOAP Message拦截、转发工具[下篇]

在Part I 中,我们创建了一个InterceptService,并且通过一个特殊的EndpointBehavior,ClientViaBehavior实现了message的拦截.转发功能.在本节中 ...

FreeSWITCH第三方库（其他）的简单介绍（三）

FreeSWITCH使用了大量的第三方库,本文档主要介绍关联相关库的信息: 音频相关库的信息介绍参考:http://www.cnblogs.com/yoyotl/p/5486753.html 视频相关 ...

计算1+2+3+...+100，使用递归算法实现。

问题描述计算1+2+3+...+100,使用递归算法实现. 计算1+2+3+...+100,使用递归算法实现.不能使用循环语句?请问这个题目的思路是什么解决方案 #include <stdi ...

代码-java单元测试时jar读取项目中properties

问题描述 java单元测试时jar读取项目中properties 我的项目中引用同事的jar,这个jar中读取了我项目中的properties,我的properties里的value是从pom中获取的 ...

visualstudio-请问visual studio 2013 安装之后出现的那些插件的都是干什么用的？

问题描述请问visual studio 2013 安装之后出现的那些插件的都是干什么用的? microsoft visual studio 2013 安装后安装了好多插件,请问这些分别都是干什么用啊 ...

添加1.4.2 XML 架构

问题描述得到错误:需要版本为1.4.2或更高版本的模块.怎么才能添加1.4.2XML架构呢?

控件中输入的日期与数据库中的日期比较

问题描述我在数据库里边存放了一段日期,比如从2009-06-01到2009-06-30运行的时候,在一个textbox里边手动写入"日期",问题是:怎么判断你写的这个日期,在不在 ...

奇美电子员工坠楼身亡

[中国企业家网](综合报道)据外媒报道,奇美电子公司昨日发生坠楼事件.一名员工周二从其居住广东佛山厂区集体宿舍六楼坠楼身亡,该消息已得到奇美电子上海官方人士证实.目前警方已介入调查,具体死因尚不明. ...

Android下Activity的生命周期

Activity的生命周期如上图所示.当系统调用一个活动时,每个回调函数依次调用.

C#调用子窗体后关闭自身(父窗体)

问题描述 C#窗体如何实现在调用子窗体后关闭自身窗体,而被调子窗体不关闭?类似登录窗体,除了在登录窗体后出现的主界面窗体的载入方法中运行登录窗体实例,就没有其它办法能实现了吗? 解决方案解决方案二: ...

android实现真实的翻书效果

问题描述 android程序里面有许多图片,手势滑动实现图片翻页(模拟真书翻页效果).有没有实现过的,告诉一下!

Java对象奇异现象，求解

问题描述 public static void main(String[] args) { Integer count = new Integer(0); new SendThread(count). ...

EXCHANGE 2007反向解析设置问题？急！！！

问题描述你好:我们公司如果新安装了EXCHANGE2007,邮箱服务器的IP为192.168.1.201,客户端访问服务器的IP为192.168.1.202(公网IP:58.60.63.1),中心传 ...

紧急求助，关于csv上传的指定编码集 Unicode

问题描述如题,我指定了编码集为Unicode下载的csv文件,想上传这个csv文件.请问如何上传才不乱码.inttotalbytes=req.getContentLength();byte[]b=n ...

苏世民：资本之王筹办下一场“中国派对”

资本之王正在筹办他的下一场"中国派对". 比起"什么行业最值得投资"之类的议题,黑石集团董事长苏世民(史蒂夫・施瓦茨曼,Stephen Schwarzman)似 ...

ios运行问题

问题描述 The operation couldn't be completed. (FBSOpenApplicationErrorDomain error 1.) 解决方案重启模拟器或重置模拟器.

舷窗上最美的风景

如果坐在舷窗边的游客依然抱怨飞行是一件索然无味的事情,那么就只能说他不会发现美. 编辑/潘灯文/吴明磊不明白,为什么总是有靠近窗户的乘客非要等到"空姐空少"的请求下才会打开遮光 ...

AWS推出基于AI的云安全服务

AWS本周一发布了新的云服务,并且宣布FICO和Hulu将其几个关键应用程序迁移到AWS的公有云上. AWS本周发布的新服务包括将数据中心的企业工作负载迁移到云端的Migration Hub工具;管理 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.018 s.