백준

[백준] 20920 : 영단어 암기는 괴로워 (Python/파이썬)

sson-coding 2026. 1. 2. 15:10

문제 링크

https://www.acmicpc.net/problem/20920

문제

화은이는 이번 영어 시험에서 틀린 문제를 바탕으로 영어 단어 암기를 하려고 한다. 
그 과정에서 효율적으로 영어 단어를 외우기 위해 영어 단어장을 만들려 하고 있다. 
화은이가 만들고자 하는 단어장의 단어 순서는 다음과 같은 우선순위를 차례로 적용하여 만들어진다.

자주 나오는 단어일수록 앞에 배치한다.
해당 단어의 길이가 길수록 앞에 배치한다.
알파벳 사전 순으로 앞에 있는 단어일수록 앞에 배치한다
 
M보다 짧은 길이의 단어의 경우 읽는 것만으로도 외울 수 있기 때문에 길이가 
M이상인 단어들만 외운다고 한다. 화은이가 괴로운 영단어 암기를 효율적으로 할 수 있도록 
단어장을 만들어 주자.

입력

첫째 줄에는 영어 지문에 나오는 단어의 개수 N과 
외울 단어의 길이 기준이 되는 M이 공백으로 구분되어 주어진다.
(1<=N<=100,000 , 1<=M<=10)

둘째 줄부터 
N+1번째 줄까지 외울 단어를 입력받는다. 이때의 입력은 알파벳 소문자로만 주어지며 단어의 길이는 
10을 넘지 않는다.

단어장에 단어가 반드시 1개 이상 존재하는 입력만 주어진다.

출력

화은이의 단어장에 들어 있는 단어를 단어장의 앞에 위치한 단어부터 한 줄에 한 단어씩 순서대로 출력한다.

예제

입력

7 4
apple
ant
sand
apple
append
sand
sand

출력

sand
apple
append

정답 및 풀이

import sys
input = sys.stdin.readline

n, m = map(int, input().split())
word_cnt = {}

for _ in range(n):
    word = input().strip()
    if len(word) < m:
        continue
    word_cnt[word] = word_cnt.get(word, 0) + 1

words = list(word_cnt.keys())

words.sort(key=lambda x: (-word_cnt[x], -len(x), x))

print("\\n".join(words))
  1. import sys
    • 빠른 입력을 사용하기 위해 sys 모듈을 불러온다.
  2. input = sys.stdin.readline
    • 기본 input() 대신 빠른 입력 함수를 사용한다.
    • 단어 개수가 많아 시간 초과 방지를 위해 필요하다.
  3. n, m = map(int, input().split())
    • n은 입력될 단어의 개수
    • m은 외울 단어의 최소 길이이다.
  4. word_cnt = {}
    • 단어를 key, 등장 횟수를 value로 저장할 딕셔너리이다.
  5. for _ in range(n):
    • 총 n개의 단어를 입력받기 위해 반복한다.
  6. word = input().strip()
    • 단어를 입력받고 줄바꿈 문자를 제거한다.
  7. if len(word) < m: continue
    • 단어 길이가 m보다 짧으면 조건에 맞지 않으므로 무시한다.
  8. word_cnt[word] = word_cnt.get(word, 0) + 1
    • 이미 나온 단어면 기존 횟수에 1을 더한다.
    • 처음 나온 단어면 0에서 시작해 1로 저장한다.
  9. words = list(word_cnt.keys())
    • 중복이 제거된 단어들만 리스트로 만든다.
    • 정렬 대상은 이 리스트이다.
  10. words.sort(key=lambda x: (-word_cnt[x], -len(x), x))
    • 단어를 정렬한다.
    • 등장 횟수 내림차순 → 길이 내림차순 → 사전순 오름차순 기준이다.
  11. print("\\n".join(words))
    • 정렬된 단어들을 한 줄씩 출력한다.

새롭게 배운 내용 및 느낀점

  • 딕셔너리.get(key,0)
    • key 에 대응하는 값이 없으면 0 을 반환
  • sort()
    • sort(key=lambda x:…)
    • 각 원소 x 를 기준 값으로 변환한 뒤 값을 비교