设为首页收藏本站

LinuxTone | 运维专家网论坛 - 最棒的Linux运维与开源架构技术交流社区!

 找回密码
 注册

QQ登录

只需一步,快速开始

#公告#抱歉,网站将关闭,不再开放。由于PC时代已远逝 。在这个后移动互联网时代,我们继续携手前行,保持对技术的热情。共同构建linuxtone知识星球欢迎加入,一起讨论技术、招聘人才、分享资源。请新老linuxtone人 扫码移步到 知识星球:linuxtone

学习是一种信仰!分享是一种快乐!能力= 心态 * 沟通 * 知识 (你的每一天需要正能量!)

 网站的发展需要你贡献一份力量!希望你能每天坚持看贴1小时,并回答网友的问题!祝你在浏览论坛的过程中取得进步!谢谢!linuxtone加油!大家加油! 友情提示: 你今天学习了吗?你今天进步了吗?少一点抱怨!多一点进步!Life is short ! Why not linuxtone ?  

网站的发展、感谢每位坛友的努力!

查看: 4377|回复: 7

[shell] 合并两个文件内容-----求助 [复制链接]

金牌会员

明日之星

Rank: 6Rank: 6

签到
82
注册时间
2011-4-27
最后登录
2013-3-22
在线时间
189 小时
阅读权限
70
积分
3851
帖子
163
主题
11
精华
1
UID
13391
发表于 2011-5-6 17:57:55 |显示全部楼层
有两个文件,分别是: 文件1
代号 帐号
和 文件2
代号 姓名

如何合并两个文件:
代号 帐号 姓名

注意文件1里代号并不是全部在文件2里能找到。而且数据量很大。

请问怎么做呢?谢! 例如:
cat file1
--代号 --账号
  101      aa
  102      bb
  103      cc
cat file2
--代号 --姓名
  101    aaaa
  103    bbbb
  104    dddd

例外:格式要对齐,怎么实现??


Rank: 4

注册时间
2011-3-12
最后登录
2015-7-29
在线时间
80 小时
阅读权限
50
积分
854
帖子
36
主题
1
精华
0
UID
12356
发表于 2011-5-6 20:36:45 |显示全部楼层
文件1代号在2里面找不到的那些记录要怎么处理,还是只打印出共有的,下面这样的行不行

  1. [root@vm-centos ~]# cat 1
  2. id    account
  3. 101   aa
  4. 102   bb
  5. 103   cc
  6. 105   ee
  7. [root@vm-centos ~]# cat 2
  8. id    name
  9. 101   aaaa
  10. 102   bbbb
  11. 104   dddd
  12. 105   eeee
  13. [root@vm-centos ~]# awk 'NR==FNR{a[$1]=$2}NR>FNR{if(a[$1])printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2}' 1 2
  14. id              account         name
  15. 101             aa              aaaa
  16. 102             bb              bbbb
  17. 105             ee              eeee
复制代码

使用道具 举报

金牌会员

明日之星

Rank: 6Rank: 6

注册时间
2011-4-27
最后登录
2013-3-22
在线时间
189 小时
阅读权限
70
积分
3851
帖子
163
主题
11
精华
1
UID
13391
发表于 2011-5-7 06:18:24 |显示全部楼层
11st 发表于 2011-5-6 20:36
文件1代号在2里面找不到的那些记录要怎么处理,还是只打印出共有的,下面这样的行不行

id      account    name
101      aa        aaaa
102      bb        bbbb
103      cc   
104                 dddd
105      ee        eeee

11st来了啊,我希望的结果如上。help me  

使用道具 举报

Rank: 4

注册时间
2011-3-12
最后登录
2015-7-29
在线时间
80 小时
阅读权限
50
积分
854
帖子
36
主题
1
精华
0
UID
12356
发表于 2011-5-7 12:37:23 |显示全部楼层
本帖最后由 11st 于 2011-5-7 12:57 编辑

文件里没有重复记录的话可以这样子,或者你也可以把两个文件导入数据库用sql做也行
  1. [root@vm-centos ~]# awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a[i],""}' 1 2|sort -k 1 -n
  2. id              account         name
  3. 101             aa              aaaa
  4. 102             bb              bbbb
  5. 103             cc
  6. 104                             dddd
  7. 105             ee              eeee
复制代码

使用道具 举报

金牌会员

明日之星

Rank: 6Rank: 6

注册时间
2011-4-27
最后登录
2013-3-22
在线时间
189 小时
阅读权限
70
积分
3851
帖子
163
主题
11
精华
1
UID
13391
发表于 2011-5-9 18:20:11 |显示全部楼层
11st 发表于 2011-5-7 12:37
文件里没有重复记录的话可以这样子,或者你也可以把两个文件导入数据库用sql做也行

...

11st  崇拜你! ths !

使用道具 举报

Rank: 8Rank: 8

注册时间
2008-8-8
最后登录
2014-6-22
在线时间
404 小时
阅读权限
90
积分
73727
帖子
220
主题
43
精华
0
UID
192
发表于 2011-5-10 11:46:03 |显示全部楼层
awk的关联数据可真牛

使用道具 举报

Rank: 6Rank: 6

注册时间
2010-11-8
最后登录
2018-9-28
在线时间
160 小时
阅读权限
70
积分
7841
帖子
266
主题
11
精华
0
UID
11082
发表于 2011-5-10 14:25:29 |显示全部楼层
晕,我就来个效率稍微低点儿的吧
join -a1 -a2 fiel1 file2

使用道具 举报

Rank: 6Rank: 6

注册时间
2010-11-8
最后登录
2018-9-28
在线时间
160 小时
阅读权限
70
积分
7841
帖子
266
主题
11
精华
0
UID
11082
发表于 2011-5-10 14:27:03 |显示全部楼层
南极雨 发表于 2011-5-10 14:25
晕,我就来个效率稍微低点儿的吧
join -a1 -a2 fiel1 file2

晕了,测试了下,一点儿都不低....
[root@sample]# time join file5 file6
101 aa aaaa
103 cc bbbb

real    0m0.002s
user    0m0.001s
sys     0m0.001s
[root@ sample]# time awk 'NR==FNR{a[$1]=$2}NR>FNR{printf "%-10s\t%-10s\t%-10s\n", $1,a[$1],$2;delete a[$1]}END{for(i in a)printf "%-10s\t%-10s\t%-10s\n",i,a,""}' file5 file6
101             aa              aaaa      
103             cc              bbbb      
104                             dddd      
102             bb                        

real    0m0.003s
user    0m0.000s
sys     0m0.003s

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

IT运维专家网感谢您的支持

合作联系: QQ:67888954/MSN:cnseek@msn.com/mail:netseek@linuxtone.org

Archiver|手机版|感谢所有关心和支持过LinuxTone的朋友们 转载本站内容请注明原作者名及出处 ( 京ICP备08103151 )   |

GMT+8, 2020-2-18 19:11 , Processed in 0.025953 second(s), 14 queries , Apc On.

Powered by Discuz! X2 Licensed

© 2001-2011 Comsenz Inc.

回顶部