注册 登录
LUPA开源社区 返回首页

zhull1052的个人空间 http://www.lupaworld.com/?73681 [收藏] [复制] [分享] [RSS]

我的博客

Linux shell编程之实际应用

热度 6已有 1210 次阅读2011-4-28 17:49 |个人分类:shell类|系统分类:IT技术|

今天,由于工作需要,需要将某文件中提取某部分内容,且以后经常要做,于是为了提高效率,编写了一个简单的脚本
 
要提取文本的格式如下:
<p align="left" style="font-size:14px; font-weight:bold;"><a href="http://www.lupaworld.com/article-210682-1.html" target="_blank">linux脧脗脌脿脣脝碌脹鹿煤脢卤麓煤碌脛脮陆脗脭脫脦脧路拢潞 0 A.D</a>(2011-04-25)</p>
<div style="font-size:13px">    0 A.D 脢脟脫脡 WIldfire Games 驴陋路垄碌脛脙芒路脩驴莽脝陆脤篓脫脦脧路拢卢脰搂鲁脰 Windows, Mac OS X潞脥Linux隆拢陆眉脠脮脣眉路垄虏录脕脣 alpha 1 掳忙卤戮拢卢麓煤潞脜脦陋 隆掳Argonaut隆卤拢卢脮芒赂枚掳忙卤戮驴脡脪脭脮媒鲁拢脥忙拢卢碌芦驴脡脛脺禄谩鲁枚脧脰脪禄脨漏Bug隆拢脮芒赂枚脫脦脧路碌脛脭麓麓煤脗毛禄霉脫脷GPL V2路垄虏录拢卢脝盲脣眉脣脴虏脛拢卢脪么脌脰拢卢脡霉脪么脛脷脠脻禄霉脫脷CC-BY-SA脨铆驴脡脰陇路垄虏录隆拢隆颅隆颅</div>
<hr style="border:1px #f0f0f0 solid" />
。。。。
 
现在要提取的是以上两处加粗的地方,操作如下:
 
cat month.txt |grep "href"|sed -e 's/.*href="/\n/g'|sed 's/"*">/\n/g'|sed 's/<.*>//' >/root/month1.txt
 已同步至 zhull1052的微博
 已同步至 zhull1052的微博

刚表态过的朋友 (0 人)

发表评论 评论 (1 个评论)

回复 zhull1052 2011-5-3 09:25
我们可以对以上的语句进行精简,如下:
sed '/href/!d;s/.*href="/\n/g;s/"*">/\n/g;s/<.*>//' month.txt >/root/month1.txt

facelist

您需要登录后才可以评论 登录 | 注册
验证问答 换一个 验证码 换一个

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部