рд╣рдордиреЗ рдЕрд▓реНрджреЗрдмрд╛рд░рди рдХреЛ рд╕реБрд╡рд┐рдзрд╛ рдХреЗ рд╕рд╛рде рдкрдврд╝рд╛

рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдХреБрдЫ рд╣рдмреНрд░рд▓реА рд▓реЛрдЧ http://lib.aldebaran.ru рд╕рд╛рдЗрдЯ рдкрд░ рдХрд┐рддрд╛рдмреЗрдВ рдкрдврд╝рддреЗ рд╣реИрдВред рд╡реЗ рдЬрд╛рдирддреЗ рд╣реИрдВ рдХрд┐ рдкрд┐рдЫрд▓реЗ рдХреБрдЫ рд╕рдордп рд╕реЗ рд╕рд╛рдЗрдЯ рдкрд░ рдкрд╛рда рдХреЛ рдХреЙрдкреА рдХрд░рдиреЗ рд╕реЗ "рд╕рдВрд░рдХреНрд╖рд┐рдд" рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдмреЗрд╢рдХ, рдЕрдзрд┐рдХрд╛рдВрд╢ рдкреБрд╕реНрддрдХреЗрдВ рдкрдардиреАрдп рдкреНрд░рд╛рд░реВрдкреЛрдВ рдореЗрдВ рдбрд╛рдЙрдирд▓реЛрдб рдХреЗ рд▓рд┐рдП рдЙрдкрд▓рдмреНрдз рдереАрдВ, рд▓реЗрдХрд┐рди рдХрдИ рд▓реЛрдХрдкреНрд░рд┐рдп рдкреБрд╕реНрддрдХреЗрдВ рдХреЗрд╡рд▓ рдСрди-рд▓рд╛рдЗрди рдкрдврд╝реА рдЬрд╛ рд╕рдХрддреА рд╣реИрдВред рдЬреЛ рдЕрд╕реБрд╡рд┐рдзрд╛рдЬрдирдХ рд╣реИред

рдкрд╛рдпрдерди рдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕рд░рд▓ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдкреВрд░реА рдХрд┐рддрд╛рдм рдХреЛ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рддреА рд╣реИ, рд╕рд╛рде рд╣реА рд╕рд╛рде рдирдХрд▓ рдХреЛ рдореБрд╢реНрдХрд┐рд▓ рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рднреА рдмрдХрд╡рд╛рд╕ рдХреЛ рдХрд╛рдЯ рджреЗрддреА рд╣реИред



 рдЖрдпрд╛рдд urllib, re, sys
 p_key = re.compile ('http: \ / \ / lib \ .aldebaran \ Ph \ / getpage \ / 1 \ /.*? "')
 p_span = re.compile ('<span class = h> (? *?) <\ / span>')
 p_s = re.compile ('\'; s \ + = \ '')
 p_p = re.compile ('(<p>ред *? </ p>)'
 p_url_name = re.compile ('^ (http: \ / \ / lib.aldebaran.ru \ / author \ /*? __)')
 def getpage (url):
     рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВ:
         рдХреБрдВрдЬреА = p_key.findall (urllib.urlopen (url) .read) ()) [0] [- 33: -1]
     рд╕рд┐рд╡рд╛рдп:
         рдХреЛрдИ рдирд╣реАрдВ рд▓реМрдЯрд╛
     urllib.urlopen ("http://lib.aldebaran.ru/getpage/1/" + key) .read ()
     рдкреГрд╖реНрда = urllib.urlopen ("http://lib.aldebaran.ru/getpage/2/" + key) .read ()
     рдкреГрд╖реНрда = p_span.sub ('', рдкреГрд╖реНрда)
     рдкреЗрдЬ = ''ред рдЬреЙрдЗрди (p_p.findall (рдкреЗрдЬ))
     рдкреГрд╖реНрда = p_s.sub ('', рдкреГрд╖реНрда)
     рд╡рд╛рдкрд╕реА рдкреГрд╖реНрда

 url = sys.argv [1]
 url = p_url_name.findall (url) [0]
 рдореИрдВ = рез
 рдЬрдмрдХрд┐ рд╕рдЪ:
     рдкреГрд╖реНрда = рдЧреЗрдЯрдкреЗрдЬ (url + str (i) + '.html')
     рдореИрдВ + = 1
     рдпрджрд┐ рдкреГрд╖реНрда! = рдХреЛрдИ рдирд╣реАрдВ:
         рдкреНрд░рд┐рдВрдЯ рдкреГрд╖реНрда
     рдмрд╛рдХреА:
         sys.exit (0)


рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХрдорд╛рдВрдб рд▓рд╛рдЗрди рдкреИрд░рд╛рдореАрдЯрд░ рдХреЛ рдкреБрд╕реНрддрдХ рдХреЗ рдХрд┐рд╕реА рднреА рдкреГрд╖реНрда рдХреЗ рд▓рд┐рдВрдХ рдкрд░ рд▓реЗ рдЬрд╛рддреА рд╣реИ рдФрд░ рдорд╛рдирдХ рдЖрдЙрдЯрдкреБрдЯ рдкрд░ рдЗрд╕рдХреЗ рдкрд╛рда рдХреЛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддреА рд╣реИред

рдЗрд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдмрд╣реБрдд рд╕рд░рд▓ рд╣реИ:

python lit.py lib.aldebaran.ru/author/sadov_sergei/sadov_sergei_klinki_u_trona/sadov_sergei_klinki_u_nagen__0.html > lit.html





PS рдХреГрдкрдпрд╛ рдиреИрддрд┐рдХрддрд╛ рдХреЗ рдкреНрд░рд╢реНрди рдХреЛ рдПрдХ рддрд░рдл рдЫреЛрдбрд╝ рджреЗрдВред рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ, рдореИрдВ рд▓реЗрдЦрдХ рдХреЛ рд╕реАрдзреЗ рдкрд╕рдВрджреАрджрд╛ рдкреБрд╕реНрддрдХреЛрдВ рдХрд╛ рднреБрдЧрддрд╛рди рдХрд░рддрд╛ рд╣реВрдВред

рдпреБрдкреАрдбреА

рдореИрдВ рдХреЗрд╡рд▓ рдЗрддрдирд╛ рд╕реНрдорд╛рд░реНрдЯ рдирд╣реАрдВ рд╣реВрдБред рд╕реБрдЭрд╛рдП рдЧрдП рдЯрд┐рдкреНрдкрдгрд┐рдпреЛрдВ рдореЗрдВ

eBookDownloader - рдлрд╝рд┐рдХреНрдмреБрдХ, рдЕрд▓рдбреЗрдмрд░рд╛, рд▓рд╛рдЗрдЯрдкреЛрд░реНрдЯрд▓ рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рдиреЗ рд╡рд╛рд▓рд╛ рд╕рдВрдкреВрд░реНрдг рдПрдкреНрд▓рд┐рдХреЗрд╢рди (.NET рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ)

рд╕рд╛рде рд╣реА рдлрд╛рдпрд░рдлреЙрдХреНрд╕ рдбрд╛рдпрд░реЗрдХреНрдЯрдПрдХреНрд╕ рдбрд╛рдпрд░реЗрдХреНрдЯрдПрдХреНрд╕ рдХреЗ рд▓рд┐рдП рдПрдХ рдЫреЛрдЯрд╛ рдкреНрд▓рдЧ-рдЗрди



All Articles