유닉스에는 특정 파일에서 내용 중 중복된 내용을 제거하고 출력해주는 uniq라는 명령어가 있는데, 이 명령어는 연속으로 있으면 중복을 체크하여 하나만 남기고 삭제하는데 떨어져 있는 데이터에 대해서는 확인할 수가 없다는 단점이 있습니다. 이 문제는 유닉스에서 제공하는 sort명령을 함께 사용하면 해결이 가능한데, sort 명령 결과를 uniq 명령을 이용하여 중복을 배제하고 출력하도록 하면 해결할 수 있습니다.
용어체크
1. 출력 리다이렉션
- 유닉스에서 제공하는 출력 리다이렉션에는 >과 >>가 있음
- >: 기존 파일의 내용을 삭제하고 새로 결과를 저장
- >>: 기존 파일의 내용 뒤에 결과를 추가
2. 표준 입출력
- 입출력을 위한 파일이나 주변 장치를 특별히 지정하지 않았을 경우에 사용
- 일반적으로 표준 입력은 키보드를 통한 입력이며, 표준 출력은 단말기 화면(모니터)의 출력임
학습내용
|
특정 파일의 내용에서 유니크한, 전혀 중복되지 않는 내용만 추출하는 방법은 무엇일까요?
학습정리
1. 파일에서 정보 추출
- uniq: 중복된 파일 내용 삭제, sort와 함께 사용하면 더욱 효과가 좋음(sort test_uniq | uniq)
- cut: 특정 필드만 잘라냄(cut -f 2 test_cut)
2. 파일의 연결
- 필드 붙이기: paste test_paste1 test_paste2
- 수평 붙이기: paste -s test_paste1 test_paste2
3. 파일 내용 변환
- 파일 변환: dd if=mypc.txt of=test_dd1 conv=ascii
- 파일 내용 삭제: dd if=/dev/null of=test_dd2
'컴퓨터공학 > 컴퓨터시스템' 카테고리의 다른 글
컴퓨터시스템 13 - 2 파일 송수신 명령어 익히기 (0) | 2021.11.20 |
---|---|
컴퓨터시스템 13 - 1 통신 명령어 익히기 (0) | 2021.11.16 |
컴퓨터시스템 10 - 2 포그라운드와 백그라운드 처리하기 (0) | 2021.10.28 |
컴퓨터시스템 10 - 1 프로세스에 대해 알아보기 (0) | 2021.10.27 |
컴퓨터 시스템 9 - 2 함수와 디버깅 (0) | 2021.10.23 |