11066번: 파일 합치기
소설가인 김대전은 소설을 여러 장(chapter)으로 나누어 쓰는데, 각 장은 각각 다른 파일에 저장하곤 한다. 소설의 모든 장을 쓰고 나서는 각 장이 쓰여진 파일을 합쳐서 최종적으로 소설의 완성본
www.acmicpc.net
문제
소설가인 김대전은 소설을 여러 장(chapter)으로 나누어 쓰는데, 각 장은 각각 다른 파일에 저장하곤 한다. 소설의 모든 장을 쓰고 나서는 각 장이 쓰여진 파일을 합쳐서 최종적으로 소설의 완성본이 들어있는 한 개의 파일을 만든다. 이 과정에서 두 개의 파일을 합쳐서 하나의 임시파일을 만들고, 이 임시파일이나 원래의 파일을 계속 두 개씩 합쳐서 소설의 여러 장들이 연속이 되도록 파일을 합쳐나가고, 최종적으로는 하나의 파일로 합친다. 두 개의 파일을 합칠 때 필요한 비용(시간 등)이 두 파일 크기의 합이라고 가정할 때, 최종적인 한 개의 파일을 완성하는데 필요한 비용의 총 합을 계산하시오.
예를 들어, C1, C2, C3, C4가 연속적인 네 개의 장을 수록하고 있는 파일이고, 파일 크기가 각각 40, 30, 30, 50 이라고 하자. 이 파일들을 합치는 과정에서, 먼저 C2와 C3를 합쳐서 임시파일 X1을 만든다. 이때 비용 60이 필요하다. 그 다음으로 C1과 X1을 합쳐 임시파일 X2를 만들면 비용 100이 필요하다. 최종적으로 X2와 C4를 합쳐 최종파일을 만들면 비용 150이 필요하다. 따라서, 최종의 한 파일을 만드는데 필요한 비용의 합은 60+100+150=310 이다. 다른 방법으로 파일을 합치면 비용을 줄일 수 있다. 먼저 C1과 C2를 합쳐 임시파일 Y1을 만들고, C3와 C4를 합쳐 임시파일 Y2를 만들고, 최종적으로 Y1과 Y2를 합쳐 최종파일을 만들 수 있다. 이때 필요한 총 비용은 70+80+150=300 이다.
소설의 각 장들이 수록되어 있는 파일의 크기가 주어졌을 때, 이 파일들을 하나의 파일로 합칠 때 필요한 최소비용을 계산하는 프로그램을 작성하시오.
입력
프로그램은 표준 입력에서 입력 데이터를 받는다. 프로그램의 입력은 T개의 테스트 데이터로 이루어져 있는데, T는 입력의 맨 첫 줄에 주어진다.각 테스트 데이터는 두 개의 행으로 주어지는데, 첫 행에는 소설을 구성하는 장의 수를 나타내는 양의 정수 K (3 ≤ K ≤ 500)가 주어진다. 두 번째 행에는 1장부터 K장까지 수록한 파일의 크기를 나타내는 양의 정수 K개가 주어진다. 파일의 크기는 10,000을 초과하지 않는다.
출력
프로그램은 표준 출력에 출력한다. 각 테스트 데이터마다 정확히 한 행에 출력하는데, 모든 장을 합치는데 필요한 최소비용을 출력한다.
코드
for _ in range(int(input())):
k = int(input())
file = list(map(int, input().split()))
# dp 배열 생성
dp = [[0 for _ in range(k)] for _ in range(k)]
# 우선 초기에 연속으로 된 두 파일의 합들 dp에 저장
for i in range(k - 1):
dp[i][i+1] = file[i] + file[i+1]
# 밑에서부터 올라오며 dp 배열 업데이트
for i in range(k-1, -1, -1):
for j in range(k):
if dp[i][j] == 0 and j > i:
dp[i][j] = min([dp[i][k]+dp[k+1][j] for k in range(i, j)]) + sum(file[i:j+1])
print(dp[0][k-1])
처음에 문제에 주어진 파일을 연속적으로 합치라는 말을 못 봐서 정렬해서 그리디하게 풀면 될 줄 알고 풀었는데 이상하게 나오길래 봤더니 문제를 애초에 그렇게 푸는게 아니었다...역시 골드 문제가 그렇게 쉬울리 없는데....주어진 순서대로 풀어야하는 것이었다.
파일들의 크기를 담은 배열 file이 있을 때 i번째 file부터 j번째 file까지의 합의 최소값을 담은 2차원 배열 dp를 구하여 문제를 풀 것이다.
우선 초기에 연속으로 된 파일들의 합을 dp에 저장한다.
for i in range(k - 1):
dp[i][i+1] = file[i] + file[i+1]
그리고 아래에서부터 올라오며 dp 배열의 값들을 채워준다.
dp[i][j]는 i <= k <= j일 때 dp[i][k] + dp[k][j] 값의 최소값과 i부터 j까지 파일들 크기의 누적합값(sum(file[i:j+1]))이다. 코드로 살펴보면 다음과 같다.
for i in range(k-1, -1, -1):
for j in range(k):
if dp[i][j] == 0 and j > i:
dp[i][j] = min([dp[i][k]+dp[k+1][j] for k in range(i, j)]) + sum(file[i:j+1])
PyPy3으로는 맞는데 Python3로는 이 코드는 시간 초과가 난다. 시간복잡도를 O(n^3)에서 O(n^2)으로 줄여서 통과하는 크누스 최적화라는 방법이 있다는데 설명을 봐도 잘 이해가 안돼서 우선은 보류했다...
그래서 고민해보니 이건 아무리 봐도 그리디는 절대 아니고 설마 다이나믹 프로그래밍인가 의심해봤는데 진짜 DP 문제였다. 이런 유형의 DP는 종종 나오는데 볼 때마다 문제를 봐도 유형 분석에 실패하는거 같다. 문제를 꾸준히 더 많이 풀어봐야할 거 같다.
'문제풀이 > DP' 카테고리의 다른 글
[Python/파이썬] 백준 11049번 행렬 곱셈 순서 (1) | 2022.10.05 |
---|---|
[Python/파이썬] 백준 7579번 앱 (0) | 2022.09.29 |
[Python/파이썬] 백준 2342번 Dance Dance Revolution (0) | 2022.09.09 |
[Python/파이썬] 백준 17404번 RGB거리 2 (0) | 2022.08.29 |
[Python/파이썬] 백준 10942번 팰린드롬? (0) | 2022.08.23 |