Python på OS X Server och BeautifulSoup?

Tråden skapades 2012-10-28 och har fått 2 svar. Det senaste inlägget skrevs 2012-10-29.

1

2012-10-28 13:23

#1

Mattias Hedman
Medlem ●
Sundsvall
2012-10-28 13:23

Är det någon här som pysslat med Python på en OS X Server?
Jag försöker installera Beutifulsoup och lyckas inte vidare.
python setup.py install går bra men när jag försöker använda det i mina script säger den bara:
ImportError: No module named BeautifulSoup

Anmäl Ändra Gilla Svara

2012-10-28 13:26

#2

Mattias Hedman
Medlem ●
Sundsvall
2012-10-28 13:26

Fasen sikken tur! Jag hittade på Stackoverflow (så klart) vad som var felet... tänkte inte på att det är bs4 jag kör.
Så då har importkommandot förändrats.

from bs4 import BeautifulSoup

Done. Fungerar.

Anmäl Ändra Gilla 1 Svara

2012-10-29 12:52

#3

Mattias Hedman
Medlem ●
Sundsvall
2012-10-29 12:52

Jag ska ställa den riktigt frågan nu... jag försöker utvinna text ut en webbsidan.
Så här ser en del av den webbsidan ut:

<div class="articles">
                    <h4>I dag</h4>
                    <ul class="block">
                    
                            <li>
                                <span>07:11</span>
                                <a href="/nyheter/sverige/buss-av-vagen-utanfor-mariestad">Buss av vägen utanför Mariestad</a>
                            </li>
                        
                            <li>
                                <span>06:53</span>
                                <a href="/nyheter/sverige/facket-domer-ut-superlararna">Facket dömer ut ”superlärarna”</a>
                            </li>

Jag kan hitta alla span. Jag kan hitta alla li. Men det slutresultat jag vill ha är:
['7:11', '/nyheter/sverige/buss-av-vagen-utanfor-mariestad','Buss av vägen utanför Mariestad' osv ]

Problemet med denna är just att span är utan class eller id vilket ha gjort det så mycket enklare...

Min kod just nu:

for li in soup.find_all('li'):
	s = li.find('span')
	
	if s.string != None:
		result = re.match('[1-9]', s.text)
		print result

Regex är inte min starta sida. Med denna får jag ut alla span inte rikigt vad jag vill ha... med denna kod vill jag få ut en massa tider.

Anmäl Ändra Gilla Svara

1

Bevaka tråden

Nytt i forumet

Debatterade nyheter

Senaste nytt

2 Hur ser ditt julpynt ut hemma?

0 3 ljusa tips för att hålla inbrottstjuvarna borta – använd smart belysning!

12 Slutet på något gammalt - början på något nytt

5 Rykte: Apple väntas lansera en uppdaterad 27" iMac i början av 2022

22 99mac blir Macradion på en helt ny plattform

1 Macradion: Vi släpper lös kraften tillsammans

0 Apple backar på den nya designen av Safari i macOS Monterey

24 Apple släpper macOS Monterey den 25 oktober

0 HomePod mini kommer i fler färger

91 Apple presenterar MacBook Pro, M1 Pro och M1 Max

4 Apple presenterar tredje generationens AirPods

2 Så här ser du Apples event ikväll

1 Apple Watch Series 7 - är det värt att uppgradera?

0 Macradion: Unleash the MF appstore

7 Detta tror vi att Apple visar upp på eventet

1 Apple förlänger sitt serviceprogram för AirPods Pro

0 Rykte: MacBook Pro har samma leverantör av miniLED-paneler som iPad Pro

3 Apple bjuder in till event den 18 oktober

1 BaseLynx: Modulär laddstation utan gränser

1 Tile håller koll på allt från plånbok till nycklar men saknar en nyckelfunktion

0 Apple överklagar domen för betalning genom tredjepartsutvecklare i App Store