백준

[백준] 14425 : 문자열 집합 (Python/파이썬)

sson-coding 2025. 11. 2. 23:51

문제 링크

https://www.acmicpc.net/problem/14425

문제

총 N개의 문자열로 이루어진 집합 S가 주어진다.

입력으로 주어지는 M개의 문자열 중에서 
집합 S에 포함되어 있는 것이 총 몇 개인지 구하는 프로그램을 작성하시오.

- 시간 제한 : 2초
- 메모리 제한 : 1536MB

입력

첫째 줄에 문자열의 개수 N과 M (1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000)이 주어진다.
다음 N개의 줄에는 집합 S에 포함되어 있는 문자열들이 주어진다.
다음 M개의 줄에는 검사해야 하는 문자열들이 주어진다.
입력으로 주어지는 문자열은 알파벳 소문자로만 이루어져 있으며, 
길이는 500을 넘지 않는다. 
집합 S에 같은 문자열이 여러 번 주어지는 경우는 없다.

출력

첫째 줄에 M개의 문자열 중에 총 몇 개가 집합 S에 포함되어 있는지 출력한다.

예제

입력

5 11
baekjoononlinejudge
startlink
codeplus
sundaycoding
codingsh
baekjoon
codeplus
codeminus
startlink
starlink
sundaycoding
codingsh
codinghs
sondaycoding
startrink
icerink

출력

4

정답 및 풀이

import sys

n, m = map(int, sys.stdin.readline().split())
set_n = set(sys.stdin.readline().strip() for _ in range(n))
cnt = 0

for _ in range(m):
    word = sys.stdin.readline().strip()
    if word in set_n:
        cnt += 1

print(cnt)
  1. import sys
    • 입력 속도를 높이기 위해 sys.stdin.readline() 사용한다.
  2. n, m = map(int, sys.stdin.readline().split())
    • 첫 번째 줄에서 두 정수를 입력받는다.
  3. set_n = set(sys.stdin.readline().strip() for _ in range(n))
    • n개의 문자열을 입력받아 set(집합)에 저장한다.
    • .strip()은 문자열 끝의 개행문자 제거한다.
    • set()은 중복 제거와 빠른 탐색(O(1))을 제공한다.
  4. cnt = 0
    • 집합 S에 포함된 문자열의 개수를 세기 위한 변수 초기화한다.
  5. for _ in range(m):
    • 검사할 문자열을 하나씩 입력받기 위해 m번 반복한다.
  6. word = sys.stdin.readline().strip()
    • 검사할 문자열을 입력받고 개행문자를 제거한다.
  7. if word in set_n:
    • 입력받은 문자열이 집합 S(set_n)에 포함되어 있다면 cnt를 1 증가한다.
    • set의 in 연산은 평균 O(1)로 매우 빠르다.
  8. print(cnt)
    • 집합 S에 포함된 문자열의 총 개수를 출력한다.