2012년 미국 연방 선거 (대통령 선거 포함)
미국 연방 선거에서는 위원회 시스템 (특히 political action committees, PACs)에 의해 무제한 기부금을 받아들이고 특정 후보자 또는 후보자 세트에 대해 지출할 수 있다.
복잡한 선거비용의 지출 네트워크를 풀어내는 것은 훌룡한 데이터과학 연습이 된다.
미 연방 선거관리위원회(Federal Election Commission, FEC)는 개인이 후보자와 위원회에 기부한 $200 이상의 모든 기부금과 각 위원회가 선거 운동에 지출한 금액의 기록을 제공하는 웹사이트를 운영하고 있다.
FEC는 또한 어느 후보자가 선거에서 얼마만큼 승리했는지에 대한 별도의 자료도 제공한다.
이들 데이터셋을 하나로 묶기 위해서는 수고가 필요하며, 수업의 전반부 동안 이러한 기술을 공부할 것이다.
이 강의에서는 데이터로부터 얻을 수 있는 정보의 시각적인 표현에 집중한다.
이 단계에서의 주안점은 특정 데이터의 메시지를 명확하고도 정확하게 전달하도록 어떻게 표시할 것인가에 있다.
사용 데이터(fec12
): 2012년 미국 연방 선거에서 각 후보에 대해 지출된 비용에 대한 자료
가장 기본적인 질문: 각 후보가 얼마나 많은 돈을 모금했나?
- 복잡한 선거 자금 방정식은 이 간단한 질문조차도 대답하기 어렵게 만듦.
- 이 질문은 생각보다 의미가 없음.
더 좋은 질문: 어느 후보에게 가장 많은 비용이 지출되었나?
- 먼저 후보별 지출(4백만불 이상)부터 간단하게 그려 보자.
Figure 1: Amount of money spent on individual candidates in the general election phase of the 2012 federal election cycle, in millions of dollars. Candidacies with at least $4 million in spending are depicted.
지출항목별 구분
Figure 2: Amount of money spent on individual candidates in the general election phase of the 2012 federal election cycle, in millions of dollars, broken down by type of spending. Candidacies with at least $4 million in spending are depicted.
이로부터 오바마에 대한 공격에 훨씬 많은 비용이 지출된 것이 확인 가능
롬니에 대해 지출된 대부분의 자금이 그를 공격하는 것이었지만, 롬니에 대한 부정적 지출의 비율(70%)은 오바마(92%)보다 낮음.
Figure 1 와 Figure 2 의 차이는 후자에서는 색상을 사용하여 세 번째 변수(지출 유형)를 그래프에 포함시켰다는 점
- 이를 통해 이전 그래프에서 도출할 수 있는 결론을 중요하게 바꾸는 명확한 비교를 할 수 있음
- 특히 먼저의 그래프에서는 오바마 대통령의 선거 자금이 롬니를 압도하는 것처럼 보였지만 실제로는 그 반대
롬니보다 오바마를 공격하는 데 훨씬 더 많은 비용이 지출되었으므로 Figure 2 에서 공화당이 이번 선거 기간 동안 자금 모금에 더 성공적이었다고 결론을 내릴 수 있다.
다음 Figure 3 에서 민주당보다 공화당 후보를 지지하는 데 더 많은 비용이 지출되었고, 공화당보다 민주당 후보를 공격하는 데 더 많은 돈이 지출되었으므로 실제로 그랬음을 확인할 수 있다. 또한 거의 모든 자금이 민주당 또는 공화당에 지출되었음을 알 수 있다.
Figure 3: Amount of money spent on individual candidacies by political party affiliation during the general election phase of the 2012 federal election cycle.
교락 (confounding)
그러나 후보자에게 지출된 돈이 실제로 정당에 따라 차이가 있었는지에 대한 질문은 조금 더 까다로움.
위에서 살펴본 바와 같이 2012년 연방 선거에서는 대선이 정치 기부금을 지배했고, 롬니 후보는 현직 대통령에 맞서는 심각히 불리한 입장에 놓임. 이 경우 대통령직이 교락 변수가 될 수 있음.
다음 Figure 4 는 Figure 3 의 기부금을 추구하는 공직별로 더 세분화
Figure 4: Amount of money spent on individual candidacies by political party affiliation during the general election phase of the 2012 federal election cycle, broken down by office being sought (House, President, or Senate).
- 모든 선출직 선거에 대해 공화당 후보를 지원하는 데 더 많은 돈이 지출된 반면, 대통령 선거에서만 민주당 후보를 공격하는 데 더 많은 돈이 지출됨.
- 공화당 하원 및 상원 후보를 공격하는 데 약간 더 많은 비용이 지출
- Figure 3 와 Figure 4 는 동일한 데이터를 표시
변동을 그래프로 표시
주장
롬니가 소수의 부유한 기부자들의 지지를 받은 반면, 오바마는 다양한 경제적 스펙트럼의 사람들로부터 지지를 받았다
Figure 5: Donations made by individuals to the PACs supporting the two major presidential candidates in the 2012 election.
- 오바마가 더 많은 소액 기부를 받은 것으로 보이지만 이 증거가 결정적인 것은 아님.
두 후보 모두 소액 기부는 많이 받았지만 고액 기부는 소수에 불과하며, 가로축의 척도 때문에 실제로 어떤 일이 벌어지고 있는지 확인하기 어려움
히스토그램을 나란히 배치하여 비교하기 어려움
대선 두 단계(예비선거와 본선거)의 모든 기부금을 한데 묶어 표시
해결 방안
- 히스토그램 대신 밀도 곡선을 사용하여 분포를 직접 비교할 수 있도록 함
- 중요한 데이터에 집중할 수 있도록 가로축(기부 금액)을 로그 척도로 변경
- 선거 단계별로 기부금을 분리
Figure 6: Donations made by individuals to the PACs supporting the two major presidential candidates in the 2012 election, separated by election phase.
- Figure 6 의 오른쪽 패널은 오바마의 기부금이 예비선거 단계에서 더 광범위한 기반에서 나왔다는 주장을 뒷받침함.
- 이 단계에서 오바마의 기부금 중 더 많은 금액이 소액으로 기부된 것으로 보임.
- 본선 단계에서는 두 캠페인에 기부된 기부금 분포에 사실상 차이가 없음.
변수간의 관계 도시
캠페인 지출이 무제한인 경우, 가장 많은 지출을 한 후보가 가장 많은 표를 얻을까?
민주당 하원선거에서 각 후보별 지출금액과 받은 투표수의 산점도를 그리면 두 변수간의 상관관계를 파악할 수 있음
Figure 7: Scatterplot illustrating the relationship between number of dollars spent supporting and number of votes earned by Democrats in 2012 elections for the House of Representatives.
Figure 8: Scatterplot illustrating the relationship between proportion of dollars spent supporting and proportion of votes earned by Democrats in the 2012 House of Representatives elections.
Figure 8 은 Figure 7 에서는 볼 수 없었던 디테일을 포함한다.
- 후보자를 지지하는 자금의 비율과 후보자의 득표율 사이에는 양의 상관관계가 있는 것으로 보인다.
- 상관관계 유무는 선거가 실제로 경합하는 산점도의 중앙에서 가장 중요.
- 이 지역을 벗어나면 한 후보자가 55% 이상의 득표율을 얻으며, 일반적으로 지출되는 비용이 거의 없음.
- 왼쪽 아래 모서리에 있는 점 중 하나는 당시 하원의장이었던 존 보너가 경쟁자 없이 출마하여 당선된 오하이오주 제8선거구
- 산점도 중앙의 점들이 더 크게 표시 — 경합 선거에 더 많은 자금이 지출
- 그러나 경합 선거에서 더 많은 재정 지원이 더 많은 득표와 상관관계가 있다는 증거는 상대적으로 약함
- 가장 많은 돈이 지출된 선거(1,100만 달러 이상)인 오하이오주 16지구에서는 선거구 재획정의 결과로 양당 현역 의원이 경합. 지출된 돈 중 51.2%가 서튼 후보를 지지하는 데 사용되었지만 서튼 후보는 48.0%의 득표율에 그침
Figure 9: Campaign funding network for candidates from Massachusetts, 2012 federal elections. Each edge represents a contribution from a PAC to a candidate.