바쁜 나날.
틈틈이 시간 나는 대로 OpenStreetMap에 자료를 입력하고 있다. 주요 고속도로 그리기가 거의 끝났다. 현재 작업한 POI는 도시명과 전국 지하철역, 그리고 24000여개의 서울시내 버스 정류장 정보다. 하루 평균 1~2시간씩 지금까지 약 10일 작업했다.
OSM 한국 지도. 별 것 아닌 것 같지만 거의 열흘이 걸려서 고속도로가 어느 정도 완성되니 흐뭇하다.
83개의 도시, 전국의 573개 지하철역 위치를 손으로 입력했다는 걸 누가 알아주기나 하겠어? 오늘은 86개의 행정 단위 군을 입력할 것이다. 이번주까지는 전국 대학 위치 정보 입력이 가능할 것 같다.
POI만 얻을 수 있어도 단순 변환하는 것만으로 OSM을 럭셔리하게 꾸밀 수 있지만 대한민국에서 이들 정보를 무료로 공개한 곳은 없는 것으로 알고 있다. 아쉽다. 그래서 내가 GPS에 사용할 목적으로 OSM을 거의 사적인 지도로 만들고 있는 셈. 나만 쓸게 아니라 이왕 하는 김에 한/영 표기를 함께 하기로 했다(think globally, act locally). 이 때문에 간단한 한글-로마자 번역 프로그램을 작성했다.
83개의 도시, 전국의 573개 지하철역 위치를 손으로 입력했다는 걸 누가 알아주기나 하겠어? 오늘은 86개의 행정 단위 군을 입력할 것이다. 이번주까지는 전국 대학 위치 정보 입력이 가능할 것 같다.
POI만 얻을 수 있어도 단순 변환하는 것만으로 OSM을 럭셔리하게 꾸밀 수 있지만 대한민국에서 이들 정보를 무료로 공개한 곳은 없는 것으로 알고 있다. 아쉽다. 그래서 내가 GPS에 사용할 목적으로 OSM을 거의 사적인 지도로 만들고 있는 셈. 나만 쓸게 아니라 이왕 하는 김에 한/영 표기를 함께 하기로 했다(think globally, act locally). 이 때문에 간단한 한글-로마자 번역 프로그램을 작성했다.
한글의 영문(로마자)표기법 개정안이 2000년에 나온 건가? 무려 9년 동안 모르고 있었군. 한글을 영문 표기로 변환해 주는 쓸만한 소스가 잘 눈에 띄지 않아 할 수 없이 '매뉴얼' 보고 만들었다. 맞는지 틀리는지 일일이 점검해 보지 않아 모르겠다. 표음 규칙들, 자음동화와 구개음화 대부분은 구현했지만, 몇몇 규칙들은 의아해서 내버려 뒀다. 캐멀 케이스(봉화->Bongjhwa가 아닌 BongHwa)와 하이픈 사용(Bong-hwa), 문자열 전/후방위 대치 등을 포함하고 facility tag를 붙일 수 있게 해 같은 범주의 POI에 대해 일괄 변환이 가능하도록.
지명 등의 고유 명사는 괜찮지만, '서울역사박물관'을 SeoUlYeokSaBakMulGwan 으로 변환한다. 외국인이 내국인에게 길을 물을 때는 표음으로 된 것이 맞긴 한데, 저렇게 되면 외국인은 이게 박물관인지 알 길이 없다. 그러므로 표기는 Seoul History Museum과 SeoUlYeokSaBakMulGwan 을 병기해야 하지 않을까? 이게 아주 귀찮은 일이라 일단은 표음으로 내버려 두고 고유 명사에 번역 가능한 일반 명사가 섞여 있을 때는 변환할 것인가를 선택했다. 벽제주유소삼거리 -> ByeokJe Petrol Station SamGeoRi. 문맥을 파악하지 않는 단순 문자열 대치이므로 은행나무입구사거리가 'Bank NaMu Entrance Crossroad' 가 되기도 한다.
한글 처리는 언제 뭘 하게 되도 기분이 나빠진다. 한글 처리를 하려면 준비해야 할 것들이 워낙 많다. 특히 조사 생략에 임의 띄어쓰기 같은 것은 난감하다. 처리를 제대로 하려면 코퍼스를 가지고 빈도수 통계를 내고 그 통계에 따라 확률 기반 마코프 체인을 구성해 렉시컬 아날라이저를 꾸미고 태깅을 하던 어떻게든 해야 할 듯. -- 이런 자연어 처리 따위를 학계나 정부에서 만들어(이미 만든 것들이 있다) 누구나 쉽게 사용할 수 있도록 공개하면 얼마나 좋을까? 한국에서는 꿈같은 얘기겠지? 공공재화로써 전자 지도 한 장 없어서 외국 공개 프로젝트 홈페이지에서 생노가다로 도로 그리고 POI 입력하는 판인데.
POI2JOSM: 한글 표기된 POI(또는 GPS에서 추출한 waypoint)를 그에 상응하는 영문 표기명으로 바꿔 OSM 포맷으로 저장하는 프로그램. 이 파일을 JOSM에서 불러들여 OSM에 한꺼번에 업로드하면 작업 시간을 절약할 수 있다. 입력 가능한 파일은 KML(UTF-8), GPX(UTF-8), Garmin CSV(POILoader에서 사용, ASC) 이고 출력 파일은 .OSM(UTF-8). 추후 생각나면 버전업할 항목:
- GPX -> GPX(한글을 영문으로 바꾸기만 해서) 옵션 추가.
- gpsbabel을 이용, 다양한 확장자의 파일을 직접 다룰 수 있게 한다.
- 한글 변환 풀옵션.
- postfix, prefix
- 상용어 변환 테이블 외부 파일로.
- 입력한 문장 즉시 변환 출력해서 클립보드 in/out
- gpsbabel을 이용, 다양한 확장자의 파일을 직접 다룰 수 있게 한다.
- 한글 변환 풀옵션.
- postfix, prefix
- 상용어 변환 테이블 외부 파일로.
- 입력한 문장 즉시 변환 출력해서 클립보드 in/out
작업자가 워낙 적어(실은 나 밖에 없는 것 같다) 프로그램을 공개하지 않았다.
메모: Visual C++ 2005 runtime 및 MFC의 unicode 파일 핸들링은 올바르지만 JOSM은 unicode BOM이 없는 파일만 정상적인 파일로 간주한다. linux에서는 unicode BOM이 없는 파일이 흔하긴 하니까 자바도 마찬가지인 것 같다. windows에서 파일을 UTF-8로 생성/저장하고 나서 파일의 첫 3 bytes로 들어가는 unicode BOM을 제거해야지만 JVM에서 작동하는 JOSM이 정상적으로 파일을 읽는다. 나중을 위해 이 3바이트 제거하는 것을 옵션으로 빼놨다.
지리산길 -- 완성된 줄 알았는데 아직도 동네 할아버지들이 삽으로 다지고 있는 중인가? 아내하고 애 데리고 한 번 가려고 했는데... 제주 올레는 약 15년 전에 가봤다. 남부 해안선 도보 일주, 한라산 횡단, 그리고 오름 몇 개 오른 정도? 서귀포시에서 한라산 방면으로 올라가기도 하고. 두 번은 자전거를 타고 돌았다. 그중 한 번은 폭풍우가 치는 날에 텐트 치고 비 맞으면서 잤다. 두번째 자전거 여행 빼고는 딱히 재미가 없었다. 회는 정말 맛있다. 하여튼 재미없는데(고생만 했는데) 다들 재밌다니, 재미있다. 동해올레란 것도 만들려나 보다. 그쪽 길도 재미없긴 마찬가지다. 지리산길에는 바람도 안 불고 햇볕을 피할 그늘이 간간이 있을 것 같다. 어쩌다 보니 그것이 지리산길의 유일한 장점처럼 보인다.
0.001mm 침범하면 천백배 보복할 것 -- 0.001mm의 천백배 보복이면 11mm냐? 미국엔 입도 벙긋 못하면서 상대적 약자(?)인 한국은 갈구는구나. 이명박 정권이 물론 잘못했지만 때만 되면 민족입네 어쩝네 하면서 발광하는 너같은 놈더러 비열하다고 하는 거야.
0.001mm 침범하면 천백배 보복할 것 -- 0.001mm의 천백배 보복이면 11mm냐? 미국엔 입도 벙긋 못하면서 상대적 약자(?)인 한국은 갈구는구나. 이명박 정권이 물론 잘못했지만 때만 되면 민족입네 어쩝네 하면서 발광하는 너같은 놈더러 비열하다고 하는 거야.
3월 8일 자전거 타고 헤이리에 갔다왔다. 주행시간: 4h30m, 쉰시간: 1h10m, 주행거리: 90.6km, 평균속도: 20.0kmh.
일산에서 출발하면 왕복 50km 거리의 썩 괜찮은 하이킹 코스가 되지만, 집에서 출발하니 반나절 거리가 되어 버렸다. 코스: 연신내역 -> 구산역 -> 원당역 -> 일산 -> 이산포 IC -> 자유로를 따라난 샛길을 죽 진행 -> 자유로 휴게소, 파주출판단지 -> 헤이리, 헤이리 영어마을.
파주 출판단지에는 처음 와봤다. 알만한 출판사 이름이 꽤 여럿이다.
송촌대교와 나란히 있는 송촌교에서 찍은 공릉천. 헤이리 사진은 안 찍었다. '문화예술촌'이란 것이 나한테는 '집창촌'같은 느낌이라서. 돌이켜 생각해 보니 파주출판단지도 집창촌 같은 느낌이었다. 건축이 주는 분위기 탓, 길가에서 호객하듯이 곱게 꽃단장하고 서 있는 건물의 열에 들어갈 마음 보다는 후다닥 지나치고 싶은 기분이 드는 점 때문에?
아니다. 집창촌이 집단창작촌의 약어라고 들은 기억이 난다.
돌아오는 길에 자유로 휴게소에 들러 라면을 사 먹었는데 꽤 잘 끓인다. 휴게소는 바이크 라이더들의 집합소 같았다. 몇 년 새 자전거 타는 사람들이 부쩍 늘었다.
돌아오는 길에 일산 호수공원에 들렀다. 해질 무렵이 되니 기온이 떨어졌다. 작년 11월에 창고에 쳐박아 두었다가 지금까지 정비 한 번 제대로 안 하고 타는 자전거를 보니 온통 흙투성이다. 올해 자전거를 네 번 탔는데, 탈 때마다 오프로드 구간을 지났다. 이번 주행은 유난히 요철이 많아 골이 많이 흔들렸고 가랑이 사이가 아팠다. 위 사진은 아픈 부위를 표시한 것. 아... 이 고물 자전거...
일산에서 출발하면 왕복 50km 거리의 썩 괜찮은 하이킹 코스가 되지만, 집에서 출발하니 반나절 거리가 되어 버렸다. 코스: 연신내역 -> 구산역 -> 원당역 -> 일산 -> 이산포 IC -> 자유로를 따라난 샛길을 죽 진행 -> 자유로 휴게소, 파주출판단지 -> 헤이리, 헤이리 영어마을.
파주 출판단지에는 처음 와봤다. 알만한 출판사 이름이 꽤 여럿이다.
송촌대교와 나란히 있는 송촌교에서 찍은 공릉천. 헤이리 사진은 안 찍었다. '문화예술촌'이란 것이 나한테는 '집창촌'같은 느낌이라서. 돌이켜 생각해 보니 파주출판단지도 집창촌 같은 느낌이었다. 건축이 주는 분위기 탓, 길가에서 호객하듯이 곱게 꽃단장하고 서 있는 건물의 열에 들어갈 마음 보다는 후다닥 지나치고 싶은 기분이 드는 점 때문에?
아니다. 집창촌이 집단창작촌의 약어라고 들은 기억이 난다.
돌아오는 길에 자유로 휴게소에 들러 라면을 사 먹었는데 꽤 잘 끓인다. 휴게소는 바이크 라이더들의 집합소 같았다. 몇 년 새 자전거 타는 사람들이 부쩍 늘었다.
돌아오는 길에 일산 호수공원에 들렀다. 해질 무렵이 되니 기온이 떨어졌다. 작년 11월에 창고에 쳐박아 두었다가 지금까지 정비 한 번 제대로 안 하고 타는 자전거를 보니 온통 흙투성이다. 올해 자전거를 네 번 탔는데, 탈 때마다 오프로드 구간을 지났다. 이번 주행은 유난히 요철이 많아 골이 많이 흔들렸고 가랑이 사이가 아팠다. 위 사진은 아픈 부위를 표시한 것. 아... 이 고물 자전거...
책 '리만 가설' (리만 가설 소개 홈페이지): 홀수 장에는 수열, 로그의 특성, 자연지수, 간단한 미적분 따위 리만 가설을 이해하기 위한 수학적 배경 지식을 소개한다. 고등학교 수준. 짝수 장에는 리만 가설의 배경과 역사를 실었다. 읽기 어려운 '수학 교양서'라서 오랫동안 읽지 않고 버티다가 요즘 읽을 것이 없어 읽었다. 첫 장부터 흥미진진. 오일러의 golden key가 등장하는 1부의 중반부에서 요새 개그맨들 말로, 빵 터졌다. 소수 정리가 이렇게 간단하단 말이야? 황금열쇠:
그럴리가... 해석학은 머리에 쥐나는 분야다. 간단하게 설명하는 것이 재주다. 수학교양서를 읽을 때마다 느끼는 거지만, 읽기 전까지 읽기를 지체하면서, 정작 읽으면 정신없이 읽고 히히덕거리게 된다. 왠만한 지식 전달 위주의 넌픽션은 시간당 50~60p 정도 진도가 나가는데, 이건 무려 75pph(pages per hour)가 나왔다. 얼마나 재미 있었으면 지하철도 두번 걸렀다. 앉으나 서나 틈만 나면 읽었다.
앤드루 오들리즈코의 말을 들어보자. "과거 한때 '소수 정리를 증명하는 사람은 영생을 얻는다'는 소문이 있었지요.실제로 아다마르와 발레 푸생은 90년 넘게 살았으니 아주 허황된 소문은 아니었던 것 같습니다. 그런데 요즘 이 소문에서 파생된 또 다른 소문이 나돌고 있씁니다. '리만 가설은 거짓일 지도 모른다. 그러나 누구든 리만 가설이 거짓임을 증명하는 사람은 그 자리에서 급사할 것이며 그가 얻은 결과는 결코 세상에 알려지지 않을 것이다'라는 지독한 소문이 바로 그것입니다"
제타 함수의 함수 평면 궤적 그래프.
'리만 가설'은 전형적인 수학 교양서라서 언제나처럼 수학 천재들이 등장하며, 입에 침이 마르도록 그들이 얼마나 천재같은지 칭송한다. 말하자면 그 동네 수퍼히어로물이다. 수퍼히어로물이자, 사회성 떨어지는 오타쿠들이 세계에 기여하는 알려지지 않은 방식을 설명해 주려 애쓰며 그들이 세운 빛나는 업적들을 소개하고 때로는 기적을 시연한다.
뫼비우스 함수를 사용한 제타함수의 다른 표현. 뭐 이 다음부터는 점점 어려워져서, 입 다물고 구경만 하세여~ 분위기다. 그나저나 수열이나 복소수나 아이겐 밸류를 참 오랫만에 봤다 -_-
힐베르트의 연설: 우리에게 주어진 과업을 완수하려면 '모든 수학 문제는 해결 가능하다'는 신념을 가져야 한다. 지금 이 순간에도 우리의 마음은 외치고 있다. 여기 문제가 있으니 해답을 찾아라! 우리는 순수한 사고를 통해 해답을 찾을 수 있다. 우리는 결코 무지하지 않으며 자연과학도 무지함과는 거리가 멀다. 그러므로 '무지함'이라는 단어는 새로운 단어로 대치되어야 한다. "우리는 알아야만 한다. 우리는 결국 알게 될 것이다."
과학사상 가장 유명하다는 힐베르트의 감동적인 연설을 기억한다. youtube 어딘가에도 있다.
시간여행자의 사랑 -- 브루노 발터, 뉴욕 필하모니, 말러 9번 교향곡. 이거 좋아하지 않을 사람이 과연 있을까? 소설에서는 시시하고 평범한 소재로 감질맛 나게 낚시질한다. 물론 낚였다. 열정과 의지가 결여된 사람은 시체같아 보인다는 것을 새삼 깨닫게 해줬다.
책에 인용된 프랜시스 톰프슨의 시
가까이 있건 멀리 있건
세상 모든 것은
영원불멸한 힘에 의해
보이지 않는 끈으로 묶여 있으니,
땅에서 꽃 한 송이만 꺾어도
하늘에서는 별 하나가 고통에 몸부림친다.
세상 모든 것은
영원불멸한 힘에 의해
보이지 않는 끈으로 묶여 있으니,
땅에서 꽃 한 송이만 꺾어도
하늘에서는 별 하나가 고통에 몸부림친다.
이 싯귀를 언젠가 들어본 기억이 있는데 통 기억 나지 않는다. 아무래도 십여년 전 어떤 과학 교양서에서 읽지 않았을까...
"담배를 피우지 않는 여성은 신용하지 않거든요" -- 오시이 마모루, 스카이 크롤러즈. 우울한 애니. 창공의 전투씬을 무척 잘 만들어서 두세 번씩 리플레이하게 만든다. 감독은 정작 독자가 알아먹을 수 있는 수준에 맞추려고 공중전의 스피드를 늦추려고 거지같은 프로펠러 전투기를 등장시켰다던데. 감독 아저씨, 시청자 배려한답시고 그런 짓 좀 하지 마세요. 댁이 잘 만들면 뭐든 프레임 단위로 안 보겠어요? 이거 원작이 좋아 보이고 전쟁쇼 벌이는 킬드런 설정도 마음에 들어요. 댁이 딱히 망친 것 같진 않지만, 그걸 SF로 만들었다면 독자가 당신이 지향하는 (그다지 공감하지도 않는) 연출의도를 못 알아차릴까봐서 설정을 틀어 버린 것 같아 아쉽다고요.
갈수록 궁상스러워지는 라이드백. 요즘 돌고 있는 사진. 한국에 외주를 줬는지 자동차 번호판이 매우 낯익다.
"담배를 피우지 않는 여성은 신용하지 않거든요" -- 오시이 마모루, 스카이 크롤러즈. 우울한 애니. 창공의 전투씬을 무척 잘 만들어서 두세 번씩 리플레이하게 만든다. 감독은 정작 독자가 알아먹을 수 있는 수준에 맞추려고 공중전의 스피드를 늦추려고 거지같은 프로펠러 전투기를 등장시켰다던데. 감독 아저씨, 시청자 배려한답시고 그런 짓 좀 하지 마세요. 댁이 잘 만들면 뭐든 프레임 단위로 안 보겠어요? 이거 원작이 좋아 보이고 전쟁쇼 벌이는 킬드런 설정도 마음에 들어요. 댁이 딱히 망친 것 같진 않지만, 그걸 SF로 만들었다면 독자가 당신이 지향하는 (그다지 공감하지도 않는) 연출의도를 못 알아차릴까봐서 설정을 틀어 버린 것 같아 아쉽다고요.
갈수록 궁상스러워지는 라이드백. 요즘 돌고 있는 사진. 한국에 외주를 줬는지 자동차 번호판이 매우 낯익다.