[Logo] MyDWBI---致力于打造最专业的中文数据仓库,商务智能社区
  [Groups]首页  [Blog] 博客   [Search] 搜索   [Recent Topics] 最新主题   [Hottest Topics] 热门主题   [Hottest Download] 热门下载   [Members]  会员列表  
[Register] 会员注册 / 
[Login] 登入 
各位有没有关于全量和增量的数据安全性方面的相关资料分享  XML
论坛首页 » Informatica
前往:   
发表人 内容
漂白的可乐

初级会员

注册时间: 2008-05-06 19:11:34
文章: 14
离线

最近在学习有关全量抽取和增量抽取的设计,忽然想到有没有关于这些抽取,遇到抽取时数据错误怎么办,就是说怎么保证要插入的数据是正确的,万一遇到不正确的数据有没有什么策略,能不能在mapping中或在workflow中实现,望大家赐教。。。

这篇文章被编辑了 1 次. 最近一次更新是在 2008-06-21 04:21:00

lynx286
一失足成千古风流人物!


论坛CEO
[Avatar]

注册时间: 2008-04-22 11:52:00
文章: 652
来自: 四海为家
离线

  • 全量抽取比较简单,导入前清空(truncate)目的表数据再导即可。

  • 数据仓库项目一般来说还是比较大的,所以etl一般也都是增量抽取的。

  • 增量抽取一般要求业务系统(oltp系统)的表最好有时间戳字段(timestamp),根据时间戳区别新旧数据,抽取新数据,此法也最常见。

  • 如果没有时间戳至少得有主键,进行主键比较,得到新数据,装载到数据仓库。比较时可根据相应工具做简单处理,如datastage中可以用crc32函数将多个字段拼接转成加密字符串,然后比较此字符串是否相同,从而判断字段值是否有变化。oracle可以用minus,left join and right join , exists 等求出新数据,导出到数据仓库。

  • 如果连主键都没有,那就不好处理了,只能全表每个字段进行比较,费时费力。所以业务系统设计时最好加时间戳字段。

  • 数据安全性一般从数据库端解决,设置好数据库用户权限,操作系统权限,网络端口,网络协议限制等。如果数据库不允许访问,可通过ftp传输平文件传输数据到etl服务器。



  • 唯大英雄能本色,是真名士自风流.
    [WWW]
     
    论坛首页 » Informatica
    前往:   

    网站地图 |  联系我们 |   |  招聘版主 |  免责声明 |  意见建议 |  系统帮助 | 
    Copyright © 2008, mydwbi.com, All Rights Reserved | Powered by JForum 2.1.8 © JForum Team