전에 잠깐 설명했는데, 좀더 자세한 내 상황을 설명하면 특정 은행계좌의 거래내역 정리하는 기능을 회사 내부 시스템에 만들고 있다. API 를 사용할 수도 있겠지만 비용이 꽤 비싸 은행사이트에서 엑셀 파일을 export 하면 그 내용을 회사 내부 시스템에 업로드 하면 DB 에 해당 레코드를 저장하는 기능을 만들고 있다.
이 때문에 은행 사이트에서 통장의 거래내역을 엑셀로 다운받아서 해당 format 을 확인 하고 있었다. 그런데 이 파일을 분석해보니 확장자는 xls 인데 실제 내용은 html 인 것을 발견했다. 다운받은 파일을 메모장에 열어보면 html 태그와 table 태그 들이 나왔다. 그런데 신기하게 엑셀 프로그램에서 열렸다. 이 파일을 다른이름으로 저장하기를 하려고 하자, 확장자가 자동으로 html 으로 저장하기가 선택되어 있었다. 그제서야 이 것은 엑셀이 htlm 파일을 읽어서 자동으로 셀로 만들 것임을 깨닫았다. 정말 이런 꼼수가 있는지 처음 알았다. 확장자를 html 으로 변경하고 크롬에서 열리는지 확인했는데 크롬에서 열렸다.
2군데의 은행사이트 내용을 정리해야 해서 2군데 은행에서 엑셀파일을 다운받았는데, 2군데 모두 이런 format 이었다. 이게 뭔가 잘 알려진 내용인지도 모르겠다. 혹시 엑셀로 만들어주는 라이브러리를 사용못할 때 써 먹을만한 꼼수같다. 그런데 나에게는 일이 복잡하게 되었다. 파이썬에서 엑셀 라이브러리로는 읽을 수 없을 것 같다. 다른 방법을 생각해 봐야 할 것 같다.
엑셀 파일을 export 했는데, html 파일이 나왔다.
2020. 6. 24. 23:45