Hack nettet uden en browser

March 1, 2022 0 Comments

Det er et traditionelt problem. Du vil have data til at udnytte i dit program, men det er på en webside. Nogle steder har en API, selvfølgelig, men normalt er du alene. Du kan tonske hele siden gennem HTTP samt analysere det. Eller du kan bruge nogle værktøjer til at “skrabe” webstedet. En fascinerende metode til at gøre dette er woob – web uden for browsere.

Systemet anvender en række backends skræddersyet på bestemte steder. Der er en samling af officielle backends, så godt som du også kan producere din egen. Når du har en backend, kan du konfigurere det såvel som udnytte det fra Python. Her er et eksempel på at opdage en bankkontosaldo:

>>> fra woob.core import woob
>>> fra woob.capabilities.bank import capbank
>>> w = woob ()
>>> W.LOAD_BACKENDS (CAPBANK)
{‘Societeegenerale’: , ‘Kreditmutuel’: }
>>> PPrint (liste (w.iter_accounts ()))
[,
,
]
>>> ACC = Næste (iter (w.iter_accounts ())))
>>> ACC.BALANCE.
Decimal (’87 .32 ‘)
Listen over tilbudte backends er imponerende, men i sidste ende vil du gerne producere dine egne moduler. Heldigvis er der masser af dokumentation om præcis, hvordan man gør det. Rammen giver dig mulighed for at offentliggøre data til webstedet såvel som hurtigt tjekket resultaterne. Hver backend har ligeledes en test, der kan finde, hvis en modifikation på webstedet bryder koden, hvilket er et typisk problem med sådanne ordninger.

Vi så ikke en hackaday backend. så godt dårligt. Der er dog talrige applikationseksempler, både konsolbaserede såvel som udnytter QT. For eksempel kan du søge efter film, håndtere opskrifter eller dating sites.

Selvfølgelig er der mange metoder mulige for dette problem. Måske har du krav på at opdage, når det næste tog forlader.

Leave a Reply

Your email address will not be published. Required fields are marked *