본문 바로가기

파이썬39

rss , Atom 그리고 RDF를 포함해, 피드를 구문 분석하는 파이썬 라이브러리 모듈인 feedparser rss , Atom 그리고 RDF를 포함해, 알려진 형식으로 피드를 구문 분석하는 파이썬 라이브러리 모듈인 feedparser가 있다. 파이썬 2.4부터 3.3 버전을 모두 지원한다고 한다.( Universal feed parser, handles RSS 0.9x, RSS 1.0, RSS 2.0, CDF, Atom 0.3, and Atom 1.0 feeds )https://pypi.python.org/pypi/feedparser 에 가면 tar파일과 설치 하는 방법등이 소개되어있다. http://www.slideshare.net/LindseySmith1/feedparser http://www.pythonforbeginners.com/feedparser/using-feedparser-in-python 에서.. 2015. 11. 10.
multiprocessing : Process-based "threading" inteface multiprocessing : Process-based "threading" intefacepython 2.6에서 기본 모듈에 추가. multiprocessing 모듈은 threading 모듈과 비슷한 API가지고 있는 process 기반의 병렬처리 알고리즘 이다. python은 Global Interpreter Lock을 이용하여 병행처리 과정에서 발생할 수 있는 문제를 방지한다. GIL은 간단한 구현 때문에 계속 사용되어 왔지만, CPU 하나만을 사용하는 것을 가정하였기 때문에 현재 처럼 CPU안에 코어가 여러개 있다고 하더라도, 실제로 병렬처리 되지 않고 한번에 하나의 thread 밖에 처리하지 않는다. multiprocessing 모듈을 이러한 문제를 회피하기 위해 process 기반으로 병렬처.. 2015. 11. 10.
XML문서 파싱하고, 검색하는 방법에 대해 알아보자. ElementTree의 parse라는 함수를 이용해 xml을 파싱할수 있다. 어트리뷰트의 값 읽기 ParseXml이라는 클래스로 구현해보자. 생성자에 self.tree , self.note 변수를 만든다. self.note.get("date") : date라는 attribute의 값을 읽는다. 태그 접근 def readTag(self): [rootmaster python]# cat parseXml.py #coding=utf8 #from xml etree.ElementTree import parse from xml.etree.ElementTree import * class ParseXml(): def __init__(self, xmlFile): self.xmlFile = xmlFile tree = pars.. 2015. 11. 10.
XML을 처리 하는 파이썬 라이브러리중 ElementTree에 대해 알아보자.( xml 생성) XML을 처리 하는 파이썬 라이브러리중 ElementTree에 대해 알아보자. ( http://effbot.org/zone/element.htm ) ElementTree 모듈을 추가한다.from xml.etree.ElementTree import *Element 생성시, 직접 attribute를 추가note = Element("note") memo = Element("memo", date='20140202')SubElement는 태그명과 태그의 텍스트값을 한번에 설정할 수 있다. 태그에 어트리뷰트 추가할수 있다. note.attrib['time'] = '20140101' [root@master python]# cat sampleXml.py #coding=utf8from xml.etree.ElementTr.. 2015. 11. 10.