原文:[原创] - C#编程大幅提高OUTLOOK的邮件搜索能力!
使用OUTLOOK, 你有没有遇到过上图的问题? 多达18419封邮件! 太多了, 每次想找一个邮件都非常耗时, 想办法解决这个问题成了一件非常紧迫的事情. 利用MS Search当然可以, 但是它太heavy了, 而且不支持如逻辑搜索表达式等复杂查找功能, 怎么办? 幸运的是我有WEBUS2.0 SDK, 于是我决定自己开发一个名为Outlook Searcher (Outlook搜索精灵) 的小工具.
Outlook搜索精灵主要包含两个功能:
1. 读取Outlook中的邮件信息并创建全文索引;
2. 提供搜索功能, 支持各种复杂的逻辑表达式.
先看看如何读取Outlook:
引用COM组件:
我这里引用的是9.4版本. 对应Outlook2010. 然后添加访问Outlook的代码:
using Outlook = Microsoft.Office.Interop.Outlook; ... Outlook.Application OutlookApp; Outlook.NameSpace OutlookNS; Outlook.MAPIFolder Inbox; Outlook.MAPIFolder Sentbox; ... void InitOutlookApp() { if (OutlookApp == null) { OutlookApp = new Outlook.Application(); OutlookNS = OutlookApp.GetNamespace("MAPI"); Inbox = OutlookNS.GetDefaultFolder(Outlook.OlDefaultFolders.olFolderInbox); //获取默认的收件箱 Sentbox = OutlookNS.GetDefaultFolder(Outlook.OlDefaultFolders.olFolderSentMail); //获取默认的已发邮件 } }
Outlook以Folder的方式来管理收件箱, 发件箱, 已发邮件等. 一般情况下, 我们接收的邮件都在"收件箱"中, 发出的邮件都在"已发邮件"中, 因此我们从这两个文件夹中获取邮件信息. 为了更加方便使用, 我创建了一个MailInfo类型来存放需要索引的邮件内容:
public class MailInfo { public string EntryId { get; set; } public string Folder { get; set; } public string From { get; set; } public string Subject { get; set; } public string ConversationId { get; set; } public string Body { get; set; } public string To { get; set; } public Document ToDoc() { var doc = new Document(); doc.Fields.Add(new Field("EntryId", this.EntryId, Webus.Documents.FieldAttributes.None)); doc.Fields.Add(new Field("Folder", this.Folder, Webus.Documents.FieldAttributes.Index)); doc.Fields.Add(new Field("From", this.From, Webus.Documents.FieldAttributes.Index)); doc.Fields.Add(new Field("Subject", this.Subject, Webus.Documents.FieldAttributes.AnalyseIndex)); doc.Fields.Add(new Field("ConversationId", this.ConversationId, Webus.Documents.FieldAttributes.Index)); doc.Fields.Add(new Field("Body", this.Body, Webus.Documents.FieldAttributes.AnalyseIndex)); doc.Fields.Add(new Field("To", this.To, Webus.Documents.FieldAttributes.Index)); return doc; } public MailInfo() { } public MailInfo(Document doc) { this.EntryId = doc.GetField("EntryId").Value.ToString(); this.Folder = doc.GetField("Folder").Value.ToString(); this.From = doc.GetField("From").Value.ToString(); this.Subject = doc.GetField("Subject").Value.ToString(); this.ConversationId = doc.GetField("ConversationId").Value.ToString(); this.Body = doc.GetField("Body").Value.ToString(); this.To = doc.GetField("To").Value.ToString(); } }
它还兼具了Mapping的功能, 能够在MailInfo和Webus.Document之间进行转换. 并且为每个字段都设定了索引选项. 现在一切就绪, 只欠东风了. 废话少说, 直接上代码:
先创建索引对象:
IIndexer IndexAccessor = null; ... private void frmOutlookSearcher_Load(object sender, EventArgs e) { ... this.IndexAccessor = new IndexManager(new MailAnalyzer()); //用MailAnalyzer作为分析器 this.IndexAccessor.MaxIndexSize = int.MaxValue; //索引大小无限制 this.IndexAccessor.MinIndexSize = int.MaxValue; //索引大小无限制 this.IndexAccessor.MergeFactor = int.MaxValue; //不做merge ... } ... private void IndexProc() { IndexAccessor.OpenOrNew(AppDomain.CurrentDomain.BaseDirectory + @"Index"); //索引数据放在运行目录的"Index"文件夹里面 ... //读取outlook, 添加文档到索引 ... }
再循环读取邮件并添加索引文档:
while(...) { //先读取inbox for (; InboxIndx <= Inbox.Items.Count; InboxIndx++) { ... this.InitOutlookApp(); var item = Inbox.Items[InboxIndx]; if (item is Outlook.MailItem) //注意, 并非每个inbox的item都是mailItem, 因此要做个类型检查, 否则程序会挂起, 死在那儿. { Outlook.MailItem mailItem = item as Outlook.MailItem; var mailInfo = new MailInfo() { EntryId = string.IsNullOrEmpty(mailItem.EntryID) ? string.Empty : mailItem.EntryID, From = string.IsNullOrEmpty(mailItem.SenderEmailAddress) ? string.Empty : mailItem.SenderEmailAddress, ConversationId = string.IsNullOrEmpty(mailItem.ConversationID) ? string.Empty : mailItem.ConversationID, Subject = string.IsNullOrEmpty(mailItem.Subject) ? string.Empty : mailItem.Subject, Body = string.IsNullOrEmpty(mailItem.HTMLBody) ? string.Empty : mailItem.HTMLBody, Folder = string.IsNullOrEmpty(Inbox.Name) ? string.Empty : Inbox.Name, To = string.IsNullOrEmpty(mailItem.To) ? string.Empty : mailItem.To }; IndexAccessor.Add(mailInfo.ToDoc()); //添加文档到索引 } ... } ... //再读取sentbox for (; SentboxIndex <= Sentbox.Items.Count; SentboxIndex++) { ... } }
最后将IndexProc放到后台线程中运行来提高用户体验:
private void frmOutlookSearcher_Load(object sender, EventArgs e) { ... this.IndexAccessor = new IndexManager(new MailAnalyzer()); //用MailAnalyzer作为分析器 this.IndexAccessor.MaxIndexSize = int.MaxValue; //索引大小无限制 this.IndexAccessor.MinIndexSize = int.MaxValue; //索引大小无限制 this.IndexAccessor.MergeFactor = int.MaxValue; //不做merge ... IndexingTask = Task.Factory.StartNew(this.IndexProc); //在后台线程编制索引 }
OK, 大功告成! Outlook搜索精灵支持如下搜索字段:
字段 | 类型 | 描述 |
Subject | string | 邮件标题 |
Body | string | 邮件正文, HTML格式 |
Folder | string | 邮件所属目录, 比如"收件箱", "已发邮件"等 |
From | string | 发件人 |
To | string | 收件人 |
ConversationId | string | 会话ID |
默认情况下, Outlook搜索精灵会使用
Subject="{0}" OR Body="{0}"
进行搜索, {0}会被自动替换成输入的关键词. 但是如果我们输入的本身就是一个搜索表达式, 那么Outlook搜索精灵会自动切换成高级搜索模式, 用用户输入的表达式进行搜索.
列举几个高级搜索的例子:
//1. 搜索标题含有"张三"并且正文含有"朋友聚餐"的邮件: Subject="张三" & Body="朋友聚餐"
//2. 在已发邮件中搜索标题中含有"张三"的邮件: Folder="[已发邮件]" AND Subject="张三"
//3. 搜索标题包含"Hotfix"的邮件: (hotfix和hotfixing都会被搜索到) Subject WILDCARD "hotfix"
这只是部分例子, 有了WEBUS2.0 SDK的支持, Outlook搜索精灵可以轻松实现7种不同类型的搜索, 并且支持复杂的逻辑搜索表达式, 具体请看 WEBUS2.0 In Action - 搜索操作指南 - (2).
为了让Outlook搜索精灵根据体贴好用, 我还设计了一些小功能, 比如Outlook连接中断自动重连, 最小化到托盘等. enjoy吧!
相关信息及WEBUS2.0 SDK下载:继续我的代码,分享我的快乐 - WEBUS2.0