首页 文章
  • 1 votes
     answers
     views

    根据列名称的多个条件提取数据框列

    我想基于多个列名标准对数据框进行子集化 . 我有一个数据框如下: id team_col_code1 team_col_code2 ... team_col_code78 Gender State team_cost_code1 team_cost_code2 ... team_cost_code43 我正在尝试对此数据框进行子集,以便新数据集仅包含包含包含单词 "col...
  • 290 votes
     answers
     views

    什么是Windows的优秀grep工具? [关闭]

    有关Windows的grep工具的任何建议?理想情况下可以利用64位操作系统 . 当然,我知道Cygwin,并且还发现了PowerGREP,但我想知道是否有任何隐藏的宝石?
  • 0 votes
     answers
     views

    如何删除带有前导和尾随空格的字符?

    我有一个文件包含带有前导和尾随空格的字符,我想简单地删除该字符 . 到目前为止,以下工作用于引导空格,而冒号表示要删除的字符: grep -v '^\s*;$' "input_file" > "output_file".tmp mv "output_file".tmp "input_file" 现在我想在有尾随...
  • 0 votes
     answers
     views

    基于另一个数据帧中的字符串对数据帧进行子集化

    我在R(df1,df2)中有2个数据帧 . df1有30列(col1到col30)以及每列的数量和不同的行数 . df2有60列和10000行 . 我想一次在df2的特定列(例如,df2 $ colx)中搜索df1的每个col中的所有字符串(例如,df1 $ colx),并将匹配字符串的整行子集化为新数据.frame(df3) . 所以最后我可以有30个不同的data.frames(对应于df...
  • 1423 votes
     answers
     views

    我如何递归grep?

    我如何递归 grep 所有目录和子目录? find . | xargs grep "texthere" *
  • 0 votes
     answers
     views

    按顺序重命名fasta标头

    我有多个fasta文件,每个文件有8个 Headers 总是以相同的顺序(在物种方面) . 例如它就像 grep -o -E "^>\w+" batch1.seq jgi jgi augustus_masked augustus_masked augustus_masked jgi augustus_masked augustus_masked 和 g...
  • 809 votes
     answers
     views

    如何管stderr,而不是stdout?

    我有一个程序将信息写入 stdout 和 stderr ,我需要 grep 通过什么来stderr,而忽略stdout . 我当然可以分两步完成: command > /dev/null 2> temp.file grep 'something' temp.file 但我宁愿能够在没有临时文件的情况下做到这一点 . 有没有任何智能管道技巧?
  • 1174 votes
     answers
     views

    如何在git历史中grep(搜索)已提交的代码?

    我过去的某个时候删除了文件或某些代码 . 我可以grep内容(不在提交消息中)吗? 一个非常糟糕的解决方案是grep日志: git log -p | grep <pattern> 但是,这不会立即返回提交哈希 . 我玩 git grep 无济于事 .
  • 726 votes
     answers
     views

    使用grep进行负匹配(匹配不包含foo的行)

    我一直在试图找出这个命令的语法: grep ! error_log | find /home/foo/public_html/ -mmin -60 要么 grep '[^error_log]' | find /home/baumerf/public_html/ -mmin -60 我需要查看已修改的所有文件,但名为 error_log 的文件除外 . I've read about it he...
  • 2919 votes
     answers
     views

    grep一个文件,但显示几个周围的行?

    我想 grep 为一个字符串,但也显示前五行和以下五行以及匹配的行 . 我怎么能这样做?
  • 277 votes
     answers
     views

    可利用的PHP功能

    我列出了应列入黑名单或不允许的功能 . 相反,我希望在搜索受感染的后台服务器时,有一个 grep -可用的红旗关键字列表 . 这个想法是,如果你想构建一个多用途的恶意PHP脚本 - 比如像c99或r57这样的“web shell”脚本 - 你将不得不使用一组或多组相对较小的函数在文件中的某个位置,以允许用户执行任意代码 . 搜索这些功能可以帮助您更快地将数万个PHP文件的大海捞变到相对较小的脚本集...
  • 2 votes
     answers
     views

    Grep包含特定关键字的文本的整个段落

    我的目标是提取包含特定关键字的文本段落 . 不只是包含关键字的行,而是整个段落 . 对我的文本文件施加的规则是每个段落都以某种模式(例如Pa0)开头,该模式仅在段落的开头用于整个文本 . 每个段落以新行字符结尾 . 例如,假设我有以下文字: Pa0 This is the first paragraph bla bla bla This is another line in the same p...
  • 103 votes
     answers
     views

    如何在Linux上使用grep搜索包含dos行结尾(CRLF)的文件?

    我想在Linux上用grep搜索包含dos行结尾的文件 . 像这样的东西: grep -IUr --color '\r\n' . 以上似乎与文字 rn 匹配,这不是所期望的 . 这个输出将通过xargs传输到todos,将crlf转换为lf,就像这样 grep -IUrl --color '^M' . | xargs -ifile fromdos 'file'
  • 117 votes
     answers
     views

    如何从另一个文件A中删除文件B上出现的行?

    我有一个很大的 file A (由电子邮件组成),每封邮件一行 . 我还有另一个包含另一组邮件的 file B . 我将使用哪个命令从文件A中删除文件B中出现的所有地址 . 那么,如果文件A包含: A B C 和文件B包含: B D E 然后文件A应该留下: A C 现在我知道这是一个可能经常被问到的问题,但是我发现one command online给了我错误的分隔符 . 任何帮...
  • 1 votes
     answers
     views

    grep -Ev不适用于我的文件

    我有两个文件包含(唯一)字符串:第一个是1.txt,有~100万个唯一字符串,2.txt有~10,000个唯一字符串 . 我想删除1.txt中所有出现的2.txt字符串,因此,当我在1.txt中搜索2.txt的出现时(使用comm命令)我发现几乎所有2.txt都在1中 . txt我使用以下命令(grep -Ev -f 2.txt 1.txt)这个命令应该给我一个9,990,000字符串的输出,但...
  • 1 votes
     answers
     views

    使用逆grep比较两个.txt文件

    我有两个.txt文件“test1.txt”和“test2.txt”,我想使用反grep(UNIX)来查找test2.txt中不包含test1.txt中任何行的所有行 test1.txt仅包含用户名,而test2.txt包含更长的文本字符串 . 我只希望test2.txt中的行不包含在test1.txt中找到的用户名 它会是什么样的? grep -v test1.txt test2.txt >...
  • 458 votes
     answers
     views

    如何从grep -R中排除目录?

    我想遍历所有子目录,除了“node_modules”目录 .
  • 1 votes
     answers
     views

    Grep word在一个文件中,并使用该单词在FASTA文件中匹配,将FASTA序列添加到第一个文件

    我想在file1中grep几个单词,并使用每个单词来grep在file2.fasta中匹配后的内容 . 然后我想将匹配后的内容添加到我用到file03中的单词,以便file03包含来自两个文件的信息 . 我的部分文件是: 文件1: Jan12345: ID1 ID2 ... IDN1 Jan67899: ID11 ID12 ... IDN2 和Fasta文件(file2)这样: >ID1 ...
  • 1 votes
     answers
     views

    使用Unix命令行工具修改FASTA标头

    我再次陷入修改文本的困境 . 我想改变大文本文件,如: >hg19_ct_UserTrack_3545_691 range=chr1:8121498-8121502 5'pad=0 3'pad=0 strand=+ repeatMasking=none GATGG >hg19_ct_UserTrack_3545_690 range=chr1:8121587-8121591 5'pad=...
  • 0 votes
     answers
     views

    从multi fasta文件中的fasta序列末尾删除空格(*)

    我有一个multifasta文件,包含来自2个abinitio工具的预测蛋白质 . 每个序列最后都包含一个空格(*) . 我想从文件中删除它 . 我的序列是这样的: >snapgene1 SFLPSAEAIEKVLSHMSRRIIDDMKAELQQPEMRWFWP* >snapgene2 SFLPSAEAIEKVLSHIIIIAAAAKKKPPFFDDMKAELQQPEMRWFWP* ...
  • 212 votes
     answers
     views

    如何让`find`忽略.svn目录?

    我经常使用 find 命令搜索源代码,删除文件等等 . 令人讨厌的是,因为Subversion在其 .svn/text-base/ 目录中存储了每个文件的重复项,所以我的简单搜索最终会得到大量重复的结果 . 例如,我想在多个 messages.h 和 messages.cpp 文件中递归搜索 uint : # find -name 'messages.*' -exec grep -Iw uint ...
  • 153 votes
     answers
     views

    如何获取进程ID以杀死nohup进程?

    我正在服务器上运行nohup进程 . 当我试图杀死它时,我的腻子控制台会关闭 . 这是我尝试查找进程ID的方法: ps -ef |grep nohup 这是杀人的命令 kill -9 1787 787
  • 1 votes
     answers
     views

    Telegraf - inputs.procstat pgrep插件问题

    Telegraf v1.0.1 启用 [[inputs.procstat]] 插件后,我无法再看到 telegraf[._] (树)指标 . Telegraf已成功安装 . 进程正在运行 . 我几乎使用输入插件和输出插件的常规设置 . 这就是我得到的: ubuntu@jenkins:/tmp/giga_aks_testing/ansible$ grep -C 2 jenkins /etc/tele...
  • 11 votes
     answers
     views

    从文件中删除包含非英语(Ascii)字符的行

    我有一个文本文件,其中包含来自不同语言的字符,如(中文,拉丁语等) 我想删除包含这些非英文字符的所有行 . 我想要包括所有英文字符(a-b),数字(0-9)和所有标点符号 . 如何使用像awk或sed这样的unix工具来完成它 .
  • 423 votes
     answers
     views

    如何使用grep在文件夹中查找单词?

    在Windows中,我会搜索在文件夹中查找单词 . 同样,我想知道在包含许多子目录和文件的目录中是否出现特定单词 . 我对grep语法的搜索显示我必须指定文件名,即 grep string filename . 现在,我不知道文件名,所以我该怎么办?一位朋友建议做 grep -nr string ,但我不知道这意味着什么,我没有得到任何结果(在我发出ctrl c之前没有回应) .
  • 517 votes
     answers
     views

    如何grep Git为某个单词提交差异或内容?

    在Git代码库中,我想列出包含特定单词的所有提交 . 我试过这个 git log -p | grep --context=4 "word" 但它并不一定会给我回文件名(除非它比我搜索的单词少了5行 . 我也尝试过 git grep "word" 但它只给我现在的文件,而不是历史 . 如何搜索整个历史记录以便我可以跟踪特定单词的更改?我的意思是在我的代码库...
  • 0 votes
     answers
     views

    在文本文件中查找常用短语

    我有一大堆文本(比如100或150个文件)和一个我想分析的新文本 . 我需要知道它是否在我的语料库中有任何文本的常用短语或部分短语(例如借用或依赖于共同来源) . 我不知道如何正确地完成这项任务,我开发了一个程序,我不能称之为非常聪明 . 我(使用sed脚本)从我的文件中成对,三,四,五个连续的单词 . 所以,例如"threes"将是以下行的文件 word1 word2 w...
  • 275 votes
     answers
     views

    如何让grep打印每条匹配线下方和上方的线? [重复]

    可能重复:grep一个文件,但显示几个周围的行? 我必须解析一个非常大的文件,我想使用命令grep(或任何其他工具) . 我想在每个日志行中搜索单词 FAILED ,然后打印每条匹配行上下的行以及匹配行 . 例如: id : 15 Satus : SUCCESS Message : no problem id : 15 Satus : FAILED Message : connection...
  • 298 votes
     answers
     views

    使用grep时获取行号

    我使用grep递归来搜索文件中的字符串,所有匹配的文件和包含该字符串的行都在终端上打印 . 但是有可能获得这些线的行号吗? 例如:我现在获得的是 /var/www/file.php: $options = "this.target" ,但我想要获得的是 /var/www/file.php: 1142 $options = "this.target"; ,其中...
  • 606 votes
     answers
     views

    如何'grep'连续流?

    是否可以在连续流上使用 grep ? 我的意思是一种 tail -f <file> 命令,但输出上有 grep ,以便只保留我感兴趣的行 . 我已经尝试了 tail -f <file> | grep pattern 但似乎 grep 只能执行 tail 完成,也就是说永远不会 .

热门问题