在DTS开发记录(1)--系统总体结构 一文中,我们介绍到映射列:“参与了数据映射的源列或目标列。注意,并不是所有的列都会参与映射,这是常见的情况。”
1.映射列分为:源映射列和目标映射列。
public interface IMappingColumn
{
string ColumnName { get;set;}
}
public interface IDestMappingColumn : IMappingColumn
{
}
public interface ISourceMappingColumn : IMappingColumn
{
ITransformRule TransformRule { get;set;}
object EmitFiledValue(DataRow row); //经过ITransformRule后的值
}
对应的类图如下:
2.ITransformRule
经常有这样的需求,我们需要把源列经过一定的运算变形后赋值给目标列,这是通过ITransformRule体现的。
public interface ITransformRule
{
object Transform(object columnVal);
}
最常用的TransformRule包括:
(1)字符串替换:比如,将源列中所有的“China”替换为“Chinese”之后赋值给目标列
(2)数值运算表达式:比如,将源列经过四则运算后赋值给目标列
(3)字符串连接:比如,将源列的字符串值衔接上“Good”后赋值给目标列
针对源列的类型(字符串、数值)不同,能够采用变形的规则也不相同,这通过ITransformRule的派生类解决。
在介绍了ITransformRule后,我们回过头来看ISourceMappingColumn的EmitFiledValue方法,EmitFiledValue方法接受一个DataRow参数,它的含义是,从DataRow中取出本列对应的field的值,然后使用ITransformRule在该值上作变换并返回结果。
3.源列分裂
有时候,我们需要将一个源列依据一定的规则分裂为多个源子列,然后在源子列与目标列之间进行映射。常见的分裂规则包括:
(1)按指定长度分裂
(2)按分隔符分裂
被分裂的源列称为IBreakupSourceMappingColumn,它从ISourceMappingColumn继承:
public interface IBreakupSourceMappingColumn : ISourceMappingColumn
{
IBreakupRule BreakupRule { get;set;}
object GetSubColumnValue(DataRow row, string subColumnName);
}
BreakupRule 属性表名该列采用的分裂规则;GetSubColumnValue是获取某个子列的在指定的DataRow中的值。
分裂规则IBreakupRule的定义如下:
public interface IBreakupRule
{
string[] SubColumnNames { get;set;}
object[] Breakup(object filedVal);
}
Breakup方法将源列值依据分裂规则分裂为多个子列值。
源子列也是从ISourceMappingColumn继承:
public interface ISubSourceMappingColumn : ISourceMappingColumn
{
IBreakupSourceMappingColumn Parent { get;set; }
}
ISubSourceMappingColumn的Parent属性反映了该子列从哪个源列分裂而来。
注意,从ISubSourceMappingColumn继承了ISourceMappingColumn的事实我们可以想到,所有能对源列采用的变形规则都可以运用于子列。
我们的原则是,当一个源列被分裂为几个子列后,我们就可以将子列与源列同等对待。有一点除外,那就是,子列不能再次被分裂(再将子列进行分裂几乎是没有任何实际意义的)。
4.源列合并
将多个源列(包括子列)按指定的规则进行合并后赋值给目标列的需求也非常常见,比如,将MathScore与ChineseScore相加后赋值给目标的TotalScore列。
由多个源列合并而成的目标列称为MergedDestMappingColumn。
MergeExpression属性是合并表达式,MergeExpressionComputer将依据目标列的类型(数值、字符串等)自动解析合并表达式和进行计算。对于表达式的解析,是一项稍微有点复杂的工作,大家可能还记得在学习数据结构的时候曾遇到过“使用堆栈求表达式的值”的题目:)
目前我们的表达式支持:+、-、*、/、log、^、(、)
大多数情况下,这已经够用了。
本文讲述了参与映射的源列和目标列,在下面一篇文章中,我们将讲述数据映射,这是DTS系统的核心概念,它完整地描述了所有的映射源列(包括子列)和映射目标列之间的映射细节。
转到:DTS开发记录(序)