-----------------------------------------------------------------
Week 6: Learning from data: classification
제6주차: 자료에서 정보 얻어내기(자료분류)
- Using machine learning tools to classify your data
수집한 자료를 분류하기 위해 기계학습 도구(분석 소프트웨어)를 활용하기
- Investigating different types of galaxies
서로다른 종류의 은하 찾기
-----------------------------------------------------------------
1강: 관측 자료 분류(Classification)-----------------------------------------------------------------
Lesson 1: Learning from Data: Classification / 한글자막
-----------------------------------------------------------------
2강: 은하의 형태 종류
Lesson 2: Types of Galaxies / 한글자막-----------------------------------------------------------------
3강: 형태에 따른 은하 분류
Lesson 3: Morphological Classification of Galaxies / 한글자막
-----------------------------------------------------------------
4강: 결정 트리 분류기의 한계
Lesson 4: Limitation of Decision Tree Classifier / 한글자막
-----------------------------------------------------------------
5강: 개선된 앙상블 분류기
Lesson 5: Improving your result with Ensemble Classifier / 한글자막
-----------------------------------------------------------------
6주/천문학자 카렌 마스터스와 인터뷰
Week 6 Interview with Karen Masters / 한글자막 / 영문자막
* 인터뷰가 무려 10분. 길고 지루하여 상당부분 의역이 있음. 하지만 내용은 재미있음.
Week 6 Interview with Karen Masters / 한글자막 / 영문자막
* 인터뷰가 무려 10분. 길고 지루하여 상당부분 의역이 있음. 하지만 내용은 재미있음.
[00:04] 안녕하세요. 저는 카렌 마스터스 박사입니다. 제가 하는 일은 영국의 다트머스 대학에서 천문학과 천체물리부 장을 맏고 있어요. 우리는 학교내에 연구소를 가지고 있는데 우주론 및 중력 연구소라고 합니다. 저는 그곳에 머물며 그곳에서 일합니다.
[당신의 연구분야에 대해 말해주세요]
[00:24] 저는 은하와 우주에서 은하의 역활에 관심을 가지고 있는데 제가 이쪽 분야에 연구경력을 쌓은 이래 쭉 관심을 가지고 있죠. 그 연구는 대규모 자료의 통계처리에 관한 겁니다. 그래서 정말 엄청난 규모의 하늘 탐사인데 다수의 천문학자들, 수많은 관측자들, 그리고 일련의 자료처리와 목록작성에 참여하는 사람들, 연구자들이 백서를 작성할 수 있도록 커다란 파일을 만들고, 자료를 발굴하는 사람들이 이 팀에 있죠. 그래서 저는 특별히 천문학 관련부분에 참여하고 있는데 그게 바로 슬로언 디지털 스카이 서베이(Sloan Digital Sky Survey) 입니다. 현재 슬로언 디지털 스카이 서베이의 대변인을 맞고 있습니다.
[01:04] 지금 그 탐사에서는 분광(스펙트럼) 탐사를 진행 중이고 우리는 많은 천체의 스펙트럼 자료를 모으는 중입니다. 그리고 대변인 으로서 저는 자료 서버의 인력관리를 담당하죠. 우리는 모두 과학자들이고 우주를 이해 하겠다는 아주 원대한 목표를 가지고 있는 사람들이죠. 그리고 같은 일을 하는 사람들의 대규모 협력을 도모하기 위해 약간의 규칙을 만듭니다. 사람들이 토론하는 게시판에는 규칙이 필요하고 합의를 이끌어 냅니다. 그래서 저는 그런 일에 참여 합니다. 또한, 미디어에 공개되는 저마다 개성있는 사람들을 다루는데 아주 재미 있죠.
[당신의 일에서 "사람들" 쪽은 얼마나 중요 할까요?]
[천문학은 얼마나 변했나요?]
[02:28] 제생각에 정말로, 솔직히 모든 천문학이 지난 2백년 동안 완전히 바뀌었다고 생각합니다. 천문학자들이 묘사된 만화영화에서는 알아채지 못하는 놀라운 기술의 발달이 있었다는 겁니다. (천문학자의 위인전 만화영화는 천문학 이야기만 나옴) 그러니까 2백년 전에 유명한 가문(Earl of Roses)의 아일랜드에 있는 영지에 세상에서 가장 큰 망원경을 세웠어요. 그리고는 그는 거대한 망원경을 통해 본 나선구조 은하 그림을 처음 그렸죠. 여러분은 사진으로 보기 전까지 믿지 못했을 겁니다. 요즘은 장노출로 찍은 수많은 은하사진을 볼 수 있습니다. 그리고 나서 소리굽쇠(은하 구분 도표)를 합치기위해 수천장의 은하 사진을 보고있는 허블(Hubble)이 되어 봅시다. 그는 크게 타원은하와 나선은하로 나눌 수 있다는 것을 깨닳았죠.
[03:15] 그리고 여러분은 CCD 소자의 개발을 맞이하게 됩니다. 전하 결합 소자(Charge Coupled Device))라는 것인데 디지털 카메라의 영상 소자죠. 일단 여러분이 그것을 손에쥐면 정말로 거대한 탐사를 시작 할 수 있어요. 그리고 디지털화된 엄청난 자료를 수집할 수 있죠. 결국 슬로언 디지털 스카이 서베이는 그중에서 참으로 대규모 였습니다. 전 하늘의 삼분의 일 가량을 영상으로 찍었고 대망의 공개 첫날은 하늘의 겨우 25% 가량 이었지만 실제로 1억개 이상의 은하가 담긴 영상들입니다. 이에 덧붙여 슬로언 자료는 약 백만개의 은하에 대한 거리도 포합되었습니다.
[03:49] 오랜동안 천문학에서 은하까지 거리는 아주 큰 문제였죠. 우리는 사진을 찍어왔죠. 천상의 구면(celestial sphere)을 이런 평평한 2차원에 담아온 겁니다. 거리를 알기 전 까지는 은하의 물리적인 속성을 이해할 수 없어요. 따라서 에드윈 허블은 다시 이쯤해서 적색편이(Red-Shift)를 활용할 수 있을 거라는 생각에 이르렀습니다. 그리하여 은하의 멀어지는 속도 그러니까 겉으로 보이는 은하의 팽창속도를 거기까지 거리를 추정해 보려고 합니다. 슬로언 계획도 그런 목적으로 백만개의 은하에 대해 스펙트럼을 측정 했습니다. 그리고 적색편이를 측정 했죠.
[04:15] 그리고 여러분에게 갑자기 CCD에 담긴 백만개의 은하 사진, 엄밀히 말하면 다 파장대(multiple wave length)로 찍은 사진이 주어졌다고 합시다. 우리는 실제 천연색 사진 혹은 강조 처리된 컬러사진(pseudo color)을 가지고 그들까지 거리를 알아 냈습니다. 몇명의 천문학자로는 백만개의 은하를 들여다보기는 곤란하죠. 그리하여 은하를 통계적으로 보기 시작 합니다. (은하사진 한개 두개에 감탄하다가 갑자기 백만개의 은하사진을 얻었다!) 그리하여 사람들은 도표에 점을 찍기 시작 했죠. 커다란 도표에 관한 주요 사항을 적은 그림이 있는데 여기에는 은하가 그저 한 점, 또는 등고선(contour)이나 히스토그램(histogram)으로 찍혀있는 것을 볼 수 있죠. 색깔로 밝기를 구분해 놓은 사진도 있죠. 이런 사진에 대부분 은하가 밀집된 양상에 따라 청색 혹은 적색으로 묘사되어 있다는 것을 알게될 겁니다. 은하의 수가 많을 수록 녹색 계곡이라고 하는데 움푹 패인 듣한 곳도 있죠.
[05:00] 슬로언 자료는 스펙트럼 자료도 있는데 스펙트럼과 관련된 연구를 할 수 있어요. 소위 BPT 도표 같은 것입니다. 이 도표는 방출선 진단용 도표(emission line diagnostics
diagram)로 방출선에서 특정 가스의 이온화가 진행되며 방출하는지 알수 있습니다.
* BPT 도표("Baldwin, Phillips & Telervich")는 성운 복사선도의 일종이다. 수소와 산소 및 질소 이온화 복사선의 비율을 도표로 나타내어 일반적인 AGN과 QSO와 구분하여 별이 형성되는 은하를 진단하는 도구로 사용된다.
https://ned.ipac.caltech.edu/level5/Glossary/Essay_bpt.html
https://en.wikipedia.org/wiki/Low-ionization_nuclear_emission-line_region

[05:14] 따라서 은하의 방출 복사선에서 가스(수소와 산소, 질소)의 이온화의 비율을 구해 별이 탄생하고 있는 영역과 별이 탄생할 수 없는 이온화 비율을 보이는 지역을 구분할 때 적용되죠. 활동성 은하핵 또는 별처럼 특이한 고에너지 물리현상이 일어나는 영역은 이 방출선이 억제됩니다.
[05:34] 이런 은하 단위의 관측은 천문학계의 혁명을 일으켜 외계은하 천문학(extragalactical astronomy)이 되었죠. 하지만 은하를 하나의 점으로 보게되면 이 은하들이 구조를 가지고 있다는 사실이 간과 됩니다. 그리하여 저는 은하 동물원(Galaxy Zoo)이 아주 흥미롭습니다. 정말로 훌륭한 기획이라고 생각해요. 은하 사진을 즐겨보는 세상 사람들에게 그 은하를 분류 해달라고 요청하여 그 결과 연구에 도움을 받고 있죠. 그리하여 우리는 은하의 외형적 특징을 얻게 되었고 시각적 정보를 가지기 시작 했습니다. 인간의 패턴 인식 능력은 아주 탁월 합니다. 우리는 특징들을 통계적으로 분류하여 디지털 자료를 얻게되었습니다. 그결과 성과로 스펙트럼 측정과 그외 디지털화된 정보들을 가지고 컴퓨터에서 실행 시킬 수 있게 됐습니다.
[당신이 이 스카이 서베이 업무를 하는 동안 가장 어려웠던 점은 무었이었나요?]
[06:17]제생각에 가장 어려웠던 점은 자료의 규모가 되겠네요. 쌓인 자료가 얼마나 될지 상상도 못할 겁니다. 슬로언 디지털 스카이 서베이의 새 탐사임무 중 하나가 망가(MaNGA)입니다. 시드니에서 수행했던 새미(SAMI)탐사와 유사한데 아마 이 강의중 언잰가 들어봤을 지도 모르겠네요. 하지만 망가는 자료구조 같은 것으로, 믿을 수 없을 만큼 다차원(복잡하고 대규모)의 탐사이죠.
* MaNGA(Mapping Nearby Galaxies at APO, Apache Point Observatory), https://www.sdss.org/surveys/manga/
* SAMI Galaxy Survey(Sydney-Australian-Astronomical-Observatory Multi-object Integral-Field Spectrograph), https://sami-survey.org/
[06:43] 탐사에 참여하는 각 연구 팀들이 쌓아놓은 자료들을 시각화하는 새로운 방법을 강구해야 했습니다. 그 결과가 어떻게 나올지 정말 흥분되었어요. 자료를 보관처리하고 그 자료에 접근하는 일은 아주 큰 사안이라고 생각합니다. 슬로언 디지털 서베이는 사람들이 쉽게 그 자료에 접근하도록 만드는 일에 세심하고도 아주 많은 노력을 기울였죠. 단지 관측 자료를 쌓아놓는 것이 아니라 자료를 조직화하는데 정성을 들인 결과 슬로언 디지털 스카이 서베이가 지금처럼 세계적으로 가장 널리 활용 될 수 있었다는데 이론의 여지가 없는 겁니다. 수많은 천문학자들이 거기에 가면 없는게 없다고 생각합니다. 그 노력이 어디까지 갈거라는 생각은 없지만 현재 진행중인 4차 SDSS가 막바지에 이른 이 시점에도, 2020년에 끝나는 지금도 여전히 진행 중입니다.
[07:35] 하지만 우리가 고려하고 있는 일들 중 하나는 여러분들이 SDSS의 데이터 베이스를SDSS의 임무가 종료된 이후에도 계속 활용 할 수 있게 할까? 입니다. 그리고 이런 자료들이 미래의 천문학자들이 활용할 수 있게 잘 보관 해두어야 겠다는 것이죠. 그것은 단순한 사진건판이 아니잖아요. 그렇죠? 지하실에 처박아 두고 손뗄 수 있는 그런것이 아니죠.
[이제 막 빅 데이터 천문학에 발을 들여놓을 사람들에게 조언을 주신다면?]
[07:58] 코딩에 자신감을 가지세요. 그리고 파이썬이 요즘은 표준이 되가는 것 같아요. 파이썬 언어가 가진 공개 소스의 본성은 아주 강고하고 이후로도 상당기간 지속될 거라고 생각 합니다. 저는 파이썬을 사용이 아주 익숙해요. 그리고 버젼 관리에 대해 더 배울 겁니다. 그리고 데이터 베이스 코딩도 배우려고 하는데 일테면 깃허브(GitHub) 같은 거요. 그리고 그것을 어떻게 활용 할지도 배워야죠. 많은 사람들이 코딩은 쉽다는 것과 도움이 된다는 것을 깨닳고 있어요. 더 많은 사람들이 어렵다고 생각하고 있기도 하죠. 하지만 여전히 노력하고 있고 해야할 필요성을 가지고 있어요. 그렇죠? 백만번 반복하지 않는한 컴퓨터를 부수지는 않을 겁니다. 시작부터 백만번 반복하진 마세요. 컴퓨터 활용에 능숙한 천문학자가 있는데 어떤일을 주면 그는 어떻게 시작할지 알고 있죠. 그들은 그 문제의 꼭데기에 서있어서 어떻하면 문제를 풀지 알고 있습니다. 내말은 이런 천문학자들은 천문학자로서 오래 머물 필요는 없다는 거죠. 희망컨데 빅 데이터 관련 회사에 가서 일하며 더 많은 돈을 벌길 바래요. 이런 일이 아주 재미있을 수도 있고 내가 보기에도 즐겁군요. 요즘은 세상 문제를 빅 데이터로 풀고 있습니다.
[09:11] 두번째 조언이라면 당신이 하는 일에 소통하길 간과하지 말라는 겁니다. 당신의 이야기를 들어줄 다른 사람들이 있다는 것을 기억하세요. 따라서 여러분은 당신의 연구에 대해 동료들과 어떻게 소통할지 배울 필요가 있죠. 그리고 다른 그룹의 사람들과도 어떻게 소통할지 배워 둘 필요가 있어요. 그리고 다양한 청중들과도 소통하는 연습을 더 많이 해야한다고 생각 합니다. 당신이 하고 싶은 이야기를 청중에 맞추는 능력을 갖추는게 좋겠죠. 청중에 맞춰야 합니다. 그리고 그 청중들이 여러분의 연구 지원서를 심사할 지도 모릅니다. 그들이 바로 여러분이 소통해야할 청중입니다. 이는 학구적 직업을 얻는데 아주 중요합니다. 학술 지원금을 얻어야 하니까요. 하지만 인생을 즐기는 것도 그만큼 중요합니다. 그러니까 코딩과 소통은 사람들이 기억하길 바라는 두개의 중요한 화두 입니다. 그것이 물리학과 천체물리학 지식의 바탕위에 필요한 겁니다.
[당신의 연구분야에 대해 말해주세요]
[01:04] 지금 그 탐사에서는 분광(스펙트럼) 탐사를 진행 중이고 우리는 많은 천체의 스펙트럼 자료를 모으는 중입니다. 그리고 대변인 으로서 저는 자료 서버의 인력관리를 담당하죠. 우리는 모두 과학자들이고 우주를 이해 하겠다는 아주 원대한 목표를 가지고 있는 사람들이죠. 그리고 같은 일을 하는 사람들의 대규모 협력을 도모하기 위해 약간의 규칙을 만듭니다. 사람들이 토론하는 게시판에는 규칙이 필요하고 합의를 이끌어 냅니다. 그래서 저는 그런 일에 참여 합니다. 또한, 미디어에 공개되는 저마다 개성있는 사람들을 다루는데 아주 재미 있죠.
[당신의 일에서 "사람들" 쪽은 얼마나 중요 할까요?]
[01:40] 과학에 관심을 가진 수많은 사람들이 있어요. 그러니까 이 질문은 사람들이 걱정하는 경력(직업)에 관한 것 중의 하나죠. 맞죠? 점점더 많은 사람들이 천체물리학에서 박사학위를 받아 천문학이나 천체물리학과 교수로 갈 수 있어요. 하지만 우리의 과학이 제대로 되길 원한다면 다양한 분야에서 일할 사람들이 필요하죠. 그리고 저는 천문학이나 천체물리학자가 되서 할 일의 안목을 넓혀놓고 생각해야 된다고 봐요. 그러니까, 소프트웨어를 작성 할 때 어떤 연속적인 과정이 있다는 것. 그러니까 우주를 연구하려면 먼저 자료를 가져야 겠죠. 그리고 당신이 천체물리학자 혹은 천문가라고 하죠. 당신이 천문가라면 먼저 장비를 구축할 겁니다. 저는 이렇게 여러 사람들이 함께 관여하는 과학의 모양새가 좋아요. 앞으로 전진하기 위해 여러 사람들이 저마다 몫을 하는 거죠. 어떤 일에 대해 생각하거나 쪽지에 공식을 적어두는 일이 연구자 만이 하는 것이라고는 생각하지 않죠.
[천문학은 얼마나 변했나요?]
[03:15] 그리고 여러분은 CCD 소자의 개발을 맞이하게 됩니다. 전하 결합 소자(Charge Coupled Device))라는 것인데 디지털 카메라의 영상 소자죠. 일단 여러분이 그것을 손에쥐면 정말로 거대한 탐사를 시작 할 수 있어요. 그리고 디지털화된 엄청난 자료를 수집할 수 있죠. 결국 슬로언 디지털 스카이 서베이는 그중에서 참으로 대규모 였습니다. 전 하늘의 삼분의 일 가량을 영상으로 찍었고 대망의 공개 첫날은 하늘의 겨우 25% 가량 이었지만 실제로 1억개 이상의 은하가 담긴 영상들입니다. 이에 덧붙여 슬로언 자료는 약 백만개의 은하에 대한 거리도 포합되었습니다.
[03:49] 오랜동안 천문학에서 은하까지 거리는 아주 큰 문제였죠. 우리는 사진을 찍어왔죠. 천상의 구면(celestial sphere)을 이런 평평한 2차원에 담아온 겁니다. 거리를 알기 전 까지는 은하의 물리적인 속성을 이해할 수 없어요. 따라서 에드윈 허블은 다시 이쯤해서 적색편이(Red-Shift)를 활용할 수 있을 거라는 생각에 이르렀습니다. 그리하여 은하의 멀어지는 속도 그러니까 겉으로 보이는 은하의 팽창속도를 거기까지 거리를 추정해 보려고 합니다. 슬로언 계획도 그런 목적으로 백만개의 은하에 대해 스펙트럼을 측정 했습니다. 그리고 적색편이를 측정 했죠.
[04:15] 그리고 여러분에게 갑자기 CCD에 담긴 백만개의 은하 사진, 엄밀히 말하면 다 파장대(multiple wave length)로 찍은 사진이 주어졌다고 합시다. 우리는 실제 천연색 사진 혹은 강조 처리된 컬러사진(pseudo color)을 가지고 그들까지 거리를 알아 냈습니다. 몇명의 천문학자로는 백만개의 은하를 들여다보기는 곤란하죠. 그리하여 은하를 통계적으로 보기 시작 합니다. (은하사진 한개 두개에 감탄하다가 갑자기 백만개의 은하사진을 얻었다!) 그리하여 사람들은 도표에 점을 찍기 시작 했죠. 커다란 도표에 관한 주요 사항을 적은 그림이 있는데 여기에는 은하가 그저 한 점, 또는 등고선(contour)이나 히스토그램(histogram)으로 찍혀있는 것을 볼 수 있죠. 색깔로 밝기를 구분해 놓은 사진도 있죠. 이런 사진에 대부분 은하가 밀집된 양상에 따라 청색 혹은 적색으로 묘사되어 있다는 것을 알게될 겁니다. 은하의 수가 많을 수록 녹색 계곡이라고 하는데 움푹 패인 듣한 곳도 있죠.
[05:00] 슬로언 자료는 스펙트럼 자료도 있는데 스펙트럼과 관련된 연구를 할 수 있어요. 소위 BPT 도표 같은 것입니다. 이 도표는 방출선 진단용 도표(emission line diagnostics
diagram)로 방출선에서 특정 가스의 이온화가 진행되며 방출하는지 알수 있습니다.
* BPT 도표("Baldwin, Phillips & Telervich")는 성운 복사선도의 일종이다. 수소와 산소 및 질소 이온화 복사선의 비율을 도표로 나타내어 일반적인 AGN과 QSO와 구분하여 별이 형성되는 은하를 진단하는 도구로 사용된다.
https://ned.ipac.caltech.edu/level5/Glossary/Essay_bpt.html
https://en.wikipedia.org/wiki/Low-ionization_nuclear_emission-line_region

[05:14] 따라서 은하의 방출 복사선에서 가스(수소와 산소, 질소)의 이온화의 비율을 구해 별이 탄생하고 있는 영역과 별이 탄생할 수 없는 이온화 비율을 보이는 지역을 구분할 때 적용되죠. 활동성 은하핵 또는 별처럼 특이한 고에너지 물리현상이 일어나는 영역은 이 방출선이 억제됩니다.
[05:34] 이런 은하 단위의 관측은 천문학계의 혁명을 일으켜 외계은하 천문학(extragalactical astronomy)이 되었죠. 하지만 은하를 하나의 점으로 보게되면 이 은하들이 구조를 가지고 있다는 사실이 간과 됩니다. 그리하여 저는 은하 동물원(Galaxy Zoo)이 아주 흥미롭습니다. 정말로 훌륭한 기획이라고 생각해요. 은하 사진을 즐겨보는 세상 사람들에게 그 은하를 분류 해달라고 요청하여 그 결과 연구에 도움을 받고 있죠. 그리하여 우리는 은하의 외형적 특징을 얻게 되었고 시각적 정보를 가지기 시작 했습니다. 인간의 패턴 인식 능력은 아주 탁월 합니다. 우리는 특징들을 통계적으로 분류하여 디지털 자료를 얻게되었습니다. 그결과 성과로 스펙트럼 측정과 그외 디지털화된 정보들을 가지고 컴퓨터에서 실행 시킬 수 있게 됐습니다.
[당신이 이 스카이 서베이 업무를 하는 동안 가장 어려웠던 점은 무었이었나요?]
[06:17]제생각에 가장 어려웠던 점은 자료의 규모가 되겠네요. 쌓인 자료가 얼마나 될지 상상도 못할 겁니다. 슬로언 디지털 스카이 서베이의 새 탐사임무 중 하나가 망가(MaNGA)입니다. 시드니에서 수행했던 새미(SAMI)탐사와 유사한데 아마 이 강의중 언잰가 들어봤을 지도 모르겠네요. 하지만 망가는 자료구조 같은 것으로, 믿을 수 없을 만큼 다차원(복잡하고 대규모)의 탐사이죠.
* MaNGA(Mapping Nearby Galaxies at APO, Apache Point Observatory), https://www.sdss.org/surveys/manga/
* SAMI Galaxy Survey(Sydney-Australian-Astronomical-Observatory Multi-object Integral-Field Spectrograph), https://sami-survey.org/
[06:43] 탐사에 참여하는 각 연구 팀들이 쌓아놓은 자료들을 시각화하는 새로운 방법을 강구해야 했습니다. 그 결과가 어떻게 나올지 정말 흥분되었어요. 자료를 보관처리하고 그 자료에 접근하는 일은 아주 큰 사안이라고 생각합니다. 슬로언 디지털 서베이는 사람들이 쉽게 그 자료에 접근하도록 만드는 일에 세심하고도 아주 많은 노력을 기울였죠. 단지 관측 자료를 쌓아놓는 것이 아니라 자료를 조직화하는데 정성을 들인 결과 슬로언 디지털 스카이 서베이가 지금처럼 세계적으로 가장 널리 활용 될 수 있었다는데 이론의 여지가 없는 겁니다. 수많은 천문학자들이 거기에 가면 없는게 없다고 생각합니다. 그 노력이 어디까지 갈거라는 생각은 없지만 현재 진행중인 4차 SDSS가 막바지에 이른 이 시점에도, 2020년에 끝나는 지금도 여전히 진행 중입니다.
[07:35] 하지만 우리가 고려하고 있는 일들 중 하나는 여러분들이 SDSS의 데이터 베이스를SDSS의 임무가 종료된 이후에도 계속 활용 할 수 있게 할까? 입니다. 그리고 이런 자료들이 미래의 천문학자들이 활용할 수 있게 잘 보관 해두어야 겠다는 것이죠. 그것은 단순한 사진건판이 아니잖아요. 그렇죠? 지하실에 처박아 두고 손뗄 수 있는 그런것이 아니죠.
[이제 막 빅 데이터 천문학에 발을 들여놓을 사람들에게 조언을 주신다면?]
[07:58] 코딩에 자신감을 가지세요. 그리고 파이썬이 요즘은 표준이 되가는 것 같아요. 파이썬 언어가 가진 공개 소스의 본성은 아주 강고하고 이후로도 상당기간 지속될 거라고 생각 합니다. 저는 파이썬을 사용이 아주 익숙해요. 그리고 버젼 관리에 대해 더 배울 겁니다. 그리고 데이터 베이스 코딩도 배우려고 하는데 일테면 깃허브(GitHub) 같은 거요. 그리고 그것을 어떻게 활용 할지도 배워야죠. 많은 사람들이 코딩은 쉽다는 것과 도움이 된다는 것을 깨닳고 있어요. 더 많은 사람들이 어렵다고 생각하고 있기도 하죠. 하지만 여전히 노력하고 있고 해야할 필요성을 가지고 있어요. 그렇죠? 백만번 반복하지 않는한 컴퓨터를 부수지는 않을 겁니다. 시작부터 백만번 반복하진 마세요. 컴퓨터 활용에 능숙한 천문학자가 있는데 어떤일을 주면 그는 어떻게 시작할지 알고 있죠. 그들은 그 문제의 꼭데기에 서있어서 어떻하면 문제를 풀지 알고 있습니다. 내말은 이런 천문학자들은 천문학자로서 오래 머물 필요는 없다는 거죠. 희망컨데 빅 데이터 관련 회사에 가서 일하며 더 많은 돈을 벌길 바래요. 이런 일이 아주 재미있을 수도 있고 내가 보기에도 즐겁군요. 요즘은 세상 문제를 빅 데이터로 풀고 있습니다.
[09:11] 두번째 조언이라면 당신이 하는 일에 소통하길 간과하지 말라는 겁니다. 당신의 이야기를 들어줄 다른 사람들이 있다는 것을 기억하세요. 따라서 여러분은 당신의 연구에 대해 동료들과 어떻게 소통할지 배울 필요가 있죠. 그리고 다른 그룹의 사람들과도 어떻게 소통할지 배워 둘 필요가 있어요. 그리고 다양한 청중들과도 소통하는 연습을 더 많이 해야한다고 생각 합니다. 당신이 하고 싶은 이야기를 청중에 맞추는 능력을 갖추는게 좋겠죠. 청중에 맞춰야 합니다. 그리고 그 청중들이 여러분의 연구 지원서를 심사할 지도 모릅니다. 그들이 바로 여러분이 소통해야할 청중입니다. 이는 학구적 직업을 얻는데 아주 중요합니다. 학술 지원금을 얻어야 하니까요. 하지만 인생을 즐기는 것도 그만큼 중요합니다. 그러니까 코딩과 소통은 사람들이 기억하길 바라는 두개의 중요한 화두 입니다. 그것이 물리학과 천체물리학 지식의 바탕위에 필요한 겁니다.
댓글 없음:
댓글 쓰기