• [코테 연습]디스크 컨트롤러

    2020. 7. 9. 12:10

    by. 위지원

    문제 설명

    하드디스크는 한 번에 하나의 작업만 수행할 수 있습니다. 디스크 컨트롤러를 구현하는 방법은 여러 가지가 있습니다. 가장 일반적인 방법은 요청이 들어온 순서대로 처리하는 것입니다.

    예를들어

    - 0ms 시점에 3ms가 소요되는 A작업 요청 - 1ms 시점에 9ms가 소요되는 B작업 요청 - 2ms 시점에 6ms가 소요되는 C작업 요청

    와 같은 요청이 들어왔습니다. 이를 그림으로 표현하면 아래와 같습니다.

     

     

    한 번에 하나의 요청만을 수행할 수 있기 때문에 각각의 작업을 요청받은 순서대로 처리하면 다음과 같이 처리 됩니다.

     

     

    - A: 3ms 시점에 작업 완료 (요청에서 종료까지 : 3ms) - B: 1ms부터 대기하다가, 3ms 시점에 작업을 시작해서 12ms 시점에 작업 완료(요청에서 종료까지 : 11ms) - C: 2ms부터 대기하다가, 12ms 시점에 작업을 시작해서 18ms 시점에 작업 완료(요청에서 종료까지 : 16ms)

    이 때 각 작업의 요청부터 종료까지 걸린 시간의 평균은 10ms(= (3 + 11 + 16) / 3)가 됩니다.

    하지만 A → C → B 순서대로 처리하면

     

     

    - A: 3ms 시점에 작업 완료(요청에서 종료까지 : 3ms) - C: 2ms부터 대기하다가, 3ms 시점에 작업을 시작해서 9ms 시점에 작업 완료(요청에서 종료까지 : 7ms) - B: 1ms부터 대기하다가, 9ms 시점에 작업을 시작해서 18ms 시점에 작업 완료(요청에서 종료까지 : 17ms)

    이렇게 A → C → B의 순서로 처리하면 각 작업의 요청부터 종료까지 걸린 시간의 평균은 9ms(= (3 + 7 + 17) / 3)가 됩니다.

    각 작업에 대해 [작업이 요청되는 시점, 작업의 소요시간]을 담은 2차원 배열 jobs가 매개변수로 주어질 때, 작업의 요청부터 종료까지 걸린 시간의 평균을 가장 줄이는 방법으로 처리하면 평균이 얼마가 되는지 return 하도록 solution 함수를 작성해주세요. (단, 소수점 이하의 수는 버립니다)

    제한 사항

    • jobs의 길이는 1 이상 500 이하입니다.
    • jobs의 각 행은 하나의 작업에 대한 [작업이 요청되는 시점, 작업의 소요시간] 입니다.
    • 각 작업에 대해 작업이 요청되는 시간은 0 이상 1,000 이하입니다.
    • 각 작업에 대해 작업의 소요시간은 1 이상 1,000 이하입니다.
    • 하드디스크가 작업을 수행하고 있지 않을 때에는 먼저 요청이 들어온 작업부터 처리합니다.

    우선,, jobs 길이가 1이면 굳이 계산할 필요가 없으니 if로 처리해서 바로 return을 하고..

    • jobs의 길이는 1 이상 500 이하입니다.

    어떻게 해결할까? 

     

    1. 시간은 계속흐른다.

    2. 현재 시간에 처리할 수 있는 작업들을 후보로 받아서 큐에 대기시킨다. 

    3. 그러다가 먼저 수행된 작업이 끝나는 시정 Tc에 시작할 친구를 큐에서 선택한다.

    예를 들어 위의 그림에서 A가 계속 수행 중이였을 때, 

    0 : A 수행중

    1 : A 수행중 B 들어옴 큐에 넣음 [ B: 9 ]

    2 : A 수행중 C 들어옴 큐에 넣음 [ B: 9, C:6 ]

    3 : A 끝남 큐에서 가장 짧게 작업을 수행할 job을 고름 C 선택

    * 대신 요청 시간이 같은 경우엔 둘 중에 더 짧게 수행을 끝내는 job 선택

    위와 같은 순서로 하면 될 것 같다.

     

     

    수행이 끝날때 마다 완료한 작업수를 cnt++; 해서 작업이 모두 완료될 때까지 while문을 돌리자.

     

    첫 시도

    import heapq
    def solution(jobs):
        n = len(jobs)
    
        if n == 1:
            return jobs[0][1]
    
        cnt = 0
        time = 0
        heap = []
        jobTime = 0
        idx = 0
        answer = 0
    
        while cnt < n:
            for i in range(idx, n):
                if jobs[i][0] <= time:
                    heapq.heappush(heap, (jobs[i][1], jobs[i][0]))
                    idx += 1
            if heap and time == jobTime:
                #내가 들어온 시간에서 지금까지 얼마나 지났는지를 측정해야하는데
                currentJob = heapq.heappop(heap)
                jobTime += currentJob[0]  # 처리 시간
                answer += jobTime - currentJob[1] #요청 시간
                cnt += 1
            else:
                time += 1
    
        return answer // n

    정확성 테스트

    테스트 1 〉 실패 (시간 초과)
    테스트 2 〉 실패 (시간 초과)
    테스트 3 〉 실패 (시간 초과)
    테스트 4 〉 실패 (시간 초과)
    테스트 5 〉 실패 (시간 초과)
    테스트 6 〉 실패 (시간 초과)
    테스트 7 〉 실패 (시간 초과)
    테스트 8 〉 실패 (시간 초과)
    테스트 9 〉 실패 (시간 초과)
    테스트 10 〉 실패 (시간 초과)
    테스트 11 〉 실패 (시간 초과)
    테스트 12 〉 실패 (시간 초과)
    테스트 13 〉 실패 (시간 초과)
    테스트 14 〉 실패 (시간 초과)
    테스트 15 〉 실패 (시간 초과)
    테스트 16 〉 실패 (시간 초과)
    테스트 17 〉 실패 (시간 초과)
    테스트 18 〉 실패 (시간 초과)
    테스트 19 〉 실패 (시간 초과)
    테스트 20 통과 (0.03ms, 10.7MB)

    ... 무엇이 이렇게 시간을 흐르게 만든 것일까? 고민하고 고민해보니 time을 기준으로 잡으면 안될 것 같다. 그럼 while문은 아무것도 안하면서 time만큼 계속 돌아간다.

    (지난번에 라면 공장에서 배웠던 걸 생각해보자.. loop문이 쓸 때없이 돌게 만들지 말자)

    뭔가 수식을 넣어서 계산해야할 것 같다. 

     

    아래 부분을 수정해야 할 것 같다.

    if heap and time == jobTime:
     
     ...
     
    else:
       time += 1

     

    두 번째 시도 

    import heapq
    def solution(jobs):
        n = len(jobs)
    
        if n == 1:
            return jobs[0][1]
    
        cnt = 0
        heap = []
        idx = 0
        prvJobEndTime = 0
        time = 0
    
        while cnt < n:
            for i in range(idx, n):
                if jobs[i][0] <= time:
                    heapq.heappush(heap, (jobs[i][1], jobs[i][0]))
                    idx += 1
                else:
                    break
            if heap:
                currentJob = heapq.heappop(heap)
                currentJobTime = currentJob[0] + (prvJobEndTime - currentJob[1])
                time += currentJobTime
                cnt += 1
                prvJobEndTime += currentJob[0]
            else:
                time +=1
    
        return time // n

    아래 블로그에서 제공한 테스트 케이스를 돌려봤다. 

    https://minnnne.tistory.com/86

     

    프로그래머스 - 디스크 컨트롤러(Level 3)/Wanna Be 컴잘알

    문제 출처 - https://programmers.co.kr/learn/courses/30/lessons/42627?language=python3 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고,..

    minnnne.tistory.com

    테스트 1
    입력값 [[0, 3], [1, 9], [2, 6]]
    기댓값 9
    실행 결과 테스트를 통과하였습니다.
    테스트 2
    입력값 [[0, 10], [4, 10], [5, 11], [15, 2]]
    기댓값 15
    실행 결과 테스트를 통과하였습니다.
    테스트 3
    입력값 [[0, 10]]
    기댓값 10
    실행 결과 테스트를 통과하였습니다.
    테스트 4
    입력값 [[0, 10], [2, 3], [9, 3]]
    기댓값 9
    실행 결과 테스트를 통과하였습니다.
    테스트 5
    입력값 [[0, 3], [4, 3], [10, 3]]
    기댓값 3
    실행 결과 테스트를 통과하였습니다.

     

    오옷!!!?

     

    정확성 테스트

    테스트 1 〉 실패 (1.36ms, 10.8MB)
    테스트 2 〉 실패 (0.77ms, 10.9MB)
    테스트 3 〉 실패 (0.79ms, 11MB)
    테스트 4 〉 실패 (0.89ms, 10.9MB)
    테스트 5 〉 실패 (0.73ms, 10.9MB)
    테스트 6 〉 실패 (0.35ms, 10.7MB)
    테스트 7 〉 실패 (0.85ms, 10.8MB)
    테스트 8 〉 실패 (0.52ms, 10.8MB)
    테스트 9 〉 실패 (0.34ms, 10.8MB)
    테스트 10 〉 실패 (0.78ms, 10.9MB)
    테스트 11 〉 실패 (0.20ms, 10.7MB)
    테스트 12 〉 실패 (0.21ms, 10.8MB)
    테스트 13 〉 실패 (0.22ms, 10.8MB)
    테스트 14 〉 실패 (0.21ms, 10.7MB)
    테스트 15 〉 실패 (0.18ms, 10.7MB)
    테스트 16 〉 실패 (0.19ms, 10.7MB)
    테스트 17 〉 실패 (0.19ms, 10.8MB)
    테스트 18 통과 (0.04ms, 10.7MB)
    테스트 19 〉 실패 (0.20ms, 10.8MB)
    테스트 20 통과 (0.03ms, 10.7MB)

     

    ??????????????????본인 멍청함에 화나는 중 

     

     

    아,,

    • 작업은 무조건 순서대로 정렬되어있지 않음 ( 요청순으로 )
    • 같은 시간에 요청이 들어올 수 있음 

    난 왜 무조건 순서대로 들어오는건 줄 알았는가 문제 어디에도 그런 말은 없었다..

    그래서 아래와 같은 코드를 추가하였다. 테스트 케이스도 8개나 더 추가했다.

    jobs = sorted(jobs)
    테스트 1
    입력값 [[0, 3], [1, 9], [2, 6]]
    기댓값 9
    실행 결과 테스트를 통과하였습니다.
    테스트 2
    입력값 [[1, 9], [1, 4], [1, 5], [1, 7], [1, 3]]
    기댓값 13
    실행 결과 테스트를 통과하였습니다.
    테스트 3
    입력값 [[0, 9], [0, 4], [0, 5], [0, 7], [0, 3]]
    기댓값 13
    실행 결과 테스트를 통과하였습니다.
    테스트 4
    입력값 [[0, 5], [1, 2], [5, 5]]
    기댓값 6
    실행 결과 테스트를 통과하였습니다.
    테스트 5
    입력값 [[24, 10], [18, 39], [34, 20], [37, 5], [47, 22], [20, 47], [15, 2], [15, 34], [35, 43], [26, 1]]
    기댓값 74
    실행 결과 테스트를 통과하였습니다.
    테스트 6
    입력값 [[0, 10], [4, 10], [5, 11], [15, 2]]
    기댓값 15
    실행 결과 테스트를 통과하였습니다.
    테스트 7
    입력값 [[0, 10]]
    기댓값 10
    실행 결과 테스트를 통과하였습니다.
    테스트 8
    입력값 [[0, 10], [2, 3], [9, 3]]
    기댓값 9
    실행 결과 테스트를 통과하였습니다.
    테스트 9
    입력값 [[0, 3], [4, 3], [10, 3]]
    기댓값 3
    실행 결과 테스트를 통과하였습니다.

    하지만 여전히 제출에선 다 틀린다...

    ㅠ..

     

    결국 다른사람 코드를 보아따.. answer += len(heap)*heap[0]이 굉장히 인상적이였다.

    import heapq
    def solution(jobs):
        n = len(jobs)
        if n == 1:
            return jobs[0][1]
    
        cnt = 0
        time = 0
        heap = []
        answer = 0
        end = -1
    
        jobs = sorted(jobs)
    
        while cnt < n:
            for job in jobs:
                if end < job[0] <= time:  # 앞선 작업이 진행되는동안 들어오는 후보군을 찾음
                    answer += (time - job[0])
                    heapq.heappush(heap, job[1])
    
            if heap:# 대기 중인 job이 있음
                answer += len(heap) * heap[0]
                end = time
                time += heapq.heappop(heap)
                cnt += 1
            else: # 대기 중인 job은 없지만 앞으로 들어올 job은 남았음 (cnt가 모두 카운팅되지 않았으니까)
                time += 1
    
        return answer // n