컴퓨터공학/컴퓨터시스템

컴퓨터시스템 14 - 2 중복 삭제/필드 자르기와 파일 연결하기/파일 덤프

Arkeiyou 2021. 12. 1. 07:17

용어체크

1. 출력 리다이렉션

  • 유닉스에서 제공하는 출력 리다이렉션에는 >과 >>가 있음
  • >: 기존 파일의 내용을 삭제하고 새로 결과를 저장
  • >>: 기존 파일의 내용 뒤에 결과를 추가

2. 표준 입출력

  • 입출력을 위한 파일이나 주변 장치를 특별히 지정하지 않았을 경우에 사용
  • 일반적으로 표준 입력은 키보드를 통한 입력이며, 표준 출력은 단말기 화면(모니터)의 출력임

 

학습내용
  • 1. 중복 삭제
  • 2. 필드 자르기와 파일 연결하기
  • 3. 파일 덤프
학습목표
  • 1. uniq 명령을 이용하여 파일이나 키보드에서 입력받는 내용 중 중복된 내용을 삭제할 수 있다.
  • 2. cut과 paste 명령어를 이용하여 파일의 각 행에서 선택된 필드를 잘라내고, 사용자가 지정한 파일의 내용을 붙일 수 있다.
  • 3. dd 명령을 이용하여 입력한 내용을 변환하여 출력할 수 있다.

 

 

 

 

 


특정 파일의 내용에서 유니크한, 전혀 중복되지 않는 내용만 추출하는 방법은 무엇일까요?

유닉스에는 특정 파일에서 내용 중 중복된 내용을 제거하고 출력해주는 uniq라는 명령어가 있는데, 이 명령어는 연속으로 있으면 중복을 체크하여 하나만 남기고 삭제하는데 떨어져 있는 데이터에 대해서는 확인할 수가 없다는 단점이 있습니다. 이 문제는 유닉스에서 제공하는 sort명령을 함께 사용하면 해결이 가능한데, sort 명령 결과를 uniq 명령을 이용하여 중복을 배제하고 출력하도록 하면 해결할 수 있습니다.



학습정리

1. 파일에서 정보 추출

  • uniq: 중복된 파일 내용 삭제, sort와 함께 사용하면 더욱 효과가 좋음(sort test_uniq | uniq)
  • cut: 특정 필드만 잘라냄(cut -f 2 test_cut)

2. 파일의 연결

  • 필드 붙이기: paste test_paste1 test_paste2
  • 수평 붙이기: paste -s test_paste1 test_paste2

3. 파일 내용 변환

  • 파일 변환: dd if=mypc.txt of=test_dd1 conv=ascii
  • 파일 내용 삭제: dd if=/dev/null of=test_dd2