sort命令
sort命令的功能是對文件中的各行進(jìn)行排序。sort命令有許多非常實(shí)用的選項(xiàng),這些選項(xiàng)最初是用來對數(shù)據(jù)庫格式的文件內(nèi)容進(jìn)行各種排序操作的。實(shí)際上,sort命令可以被認(rèn)為是一個非常強(qiáng)大的數(shù)據(jù)管理工具,用來管理內(nèi)容類似數(shù)據(jù)庫記錄的文件。
Sort命令將逐行對文件中的內(nèi)容進(jìn)行排序,如果兩行的首字符相同,該命令將繼續(xù)比較這兩行的下一字符,如果還相同,將繼續(xù)進(jìn)行比較。
語法:
sort [選項(xiàng)] 文件
說明:sort命令對指定文件中所有的行進(jìn)行排序,并將結(jié)果顯示在標(biāo)準(zhǔn)輸出上。如不指定輸入文件或使用“- ”,則表示排序內(nèi)容來自標(biāo)準(zhǔn)輸入。
sort排序是根據(jù)從輸入行抽取的一個或多個關(guān)鍵字進(jìn)行比較來完成的。排序關(guān)鍵字定義了用來排序的最小的字符序列。缺省情況下以整行為關(guān)鍵字按ASCII字符順序進(jìn)行排序。
改變?nèi)笔≡O(shè)置的選項(xiàng)主要有:
- m 若給定文件已排好序,合并文件。
- c 檢查給定文件是否已排好序,如果它們沒有都排好序,則打印一個出錯信息,并以狀態(tài)值1退出。
- u 對排序后認(rèn)為相同的行只留其中一行。
- o 輸出文件 將排序輸出寫到輸出文件中而不是標(biāo)準(zhǔn)輸出,如果輸出文件是輸入文件之一,sort先將該文件的內(nèi)容寫入一個臨時文件,然后再排序和寫輸出結(jié)果。
改變?nèi)笔∨判蛞?guī)則的選項(xiàng)主要有:
- d 按字典順序排序,比較時僅字母、數(shù)字、空格和制表符有意義。
- f 將小寫字母與大寫字母同等對待。
- I 忽略非打印字符。
- M 作為月份比較:“JAN”<“FEB”
- r 按逆序輸出排序結(jié)果。
+posl - pos2 指定一個或幾個字段作為排序關(guān)鍵字,字段位置從posl開始,到pos2為止(包括posl,不包括pos2)。如不指定pos2,則關(guān)鍵字為從posl到行尾。字段和字符的位置從0開始。
- b 在每行中尋找排序關(guān)鍵字時忽略前導(dǎo)的空白(空格和制表符)。
- t separator 指定字符separator作為字段分隔符。
uniq命令
文件經(jīng)過處理后在它的輸出文件中可能會出現(xiàn)重復(fù)的行。例如,使用cat命令將兩個文件合并后,再使用sort命令進(jìn)行排序,就可能出現(xiàn)重復(fù)行。這時可以使用uniq命令將這些重復(fù)行從輸出文件中刪除,只留下每條記錄的唯一樣本。
語法:
uniq [選項(xiàng)] 文件
說明:這個命令讀取輸入文件,并比較相鄰的行。在正常情況下,第二個及以后更多個重復(fù)行將被刪去,行比較是根據(jù)所用字符集的排序序列進(jìn)行的。該命令加工后的結(jié)果寫到輸出文件中。輸入文件和輸出文件必須不同。如果輸入文件用“- ”表示,則從標(biāo)準(zhǔn)輸入讀取。
該命令各選項(xiàng)含義如下:
- c 顯示輸出中,在每行行首加上本行在文件中出現(xiàn)的次數(shù)。它可取代- u和- d選項(xiàng)。
- d 只顯示重復(fù)行。
- u 只顯示文件中不重復(fù)的各行。
- n 前n個字段與每個字段前的空白一起被忽略。一個字段是一個非空格、非制表符的字符串,彼此由制表符和空格隔開(字段從0開始編號)。
+n 前n個字符被忽略,之前的字符被跳過(字符從0開始編號)。
- f n 與- n相同,這里n是字段數(shù)。
- s n 與+n相同,這里n是字符數(shù)。