eksperymenty z internetem, blogami, bloxem, javascriptem, firefoxem czy różnymi użytecznymi programami czy narzędziami, tak okołoinformatycznie tudzież okołokomputerowo...
Blog > Komentarze do wpisu

blox i kanał RSS z pełną treścią HTML

Nie będę robił przydługich wstępów, bo o braku pełnej treści w kanałach RSS z bloxa wiedzą wszyscy ich użytkownicy, a o serwisie feed43.com napisałem notkę poprzednią. Od razu przejdę to instrukcji, jak za jego pomocą przygotować sobie (do czytania, do niekomercyjnej publikacji) kanał RSS z dowolnego bloxa zawierający pełną treść wpisów (sformatowany HTML, zdjęcia, klipy YouTube, itp.). Obiecywałem to już dawno, a teraz opiszę.


blox.pl i feed43.com dają kanał RSS z pełną treścią HTML
Niezależnie od tego, czy założymy konto w serwisie czy nie, aby skonstruować własny kanał RSS trafimy na stronę, w której najpierw należy zaakceptować warunki licencyjne a potem przystąpić do właściwej konfiguracji, która odbywa się w kilku etapach.


KROK 1 (Step 1)
Podajemy adres bloxa, dla którego chcemy zrobić feed (ja zrobię na przykładzie mojego) oraz stronę kodową - Encoding. Blox używa iso-8859-2 (BTW czasem szkoda, że nie UTF). Wciskamy RELOAD.


KROK 2 (Step 2)
To jest najważniejsza część konfiguracji kanału. Pokazuje serwisowi sekcję strony, którą ma przeanalizować pod kątem interesującej nas zawartości - Global Search Pattern. Na bloxach interesuje nas tylko pewna część szerokiej, głównej szpalty. W niej powtarzają się wpisy, których szablon opisuje Item Search Pattern. Ilość wpisów zależy od ustawień ilości pokazujących się notek na głównej stronie. Wszelkie bloxy z niestandardowymi ustawieniami (jakaś notko-menu, jakaś ograniczona kategoria) mogą sprawiać tu trudności. Zatem:

W polu Global Search Pattern wstawiamy następujący kod:
<div id="BlogKategorieBox">{%}<div id="BlogStronicowanieBox">

W polu Item (repeatable) Search Pattern wstawiamy taką zawartość:
{*}WpisBox{*}entry_{%}"{*}ItemTytul">{%}<{*}Tresc">{%}{*}
<div class="BlogWpisInfo">{*}"IPTlinkuj" href="{%}">
Link{*}http://{*}/{%}/{%}/{*}">

Wciskamy EXTRACT.
Gdy wszystko przebiegnie poprawnie pokaże się okno Clipped Data z wyselekcjonowanymi elementami, z których w następnych krokach zbudujemy właściwe źródło RSS. Gdy coś będzie nie tak, to może jest problem z bloxem, albo coś przeoczone we wzorcach Search Patterns.


KROK 3 (Step 3)
Teraz przystępujemy do ostatecznego formatowania kanału. Zalecam nie korzystać tutaj z polskich znaków.
W sekcji RSS feed properties wartości pól Feed Title (tytuł kanału), Feed Link (link do strony), Feed Description (opis kanału) powinny się wypełnić automatycznie na podstawie danych nagłówkowych bloxa. Można je tylko skorygować pod kątem polskich liter.
Natomiast sekcję RSS item properties (właściwości poszczególnego wpisu) musimy sobie skonfigurować według własnych wymagań i na podstawie zmiennych wyselekcjonowanych w kroku drugim w polu Clipped Data. W tym najbardziej szczegółowym wzorcu, który podałem, zmienne mają następujące znaczenie:

  • {%1} - unikalny identyfikator bloxowego wpisu
  • {%2} - tytuł pojedyńczego wpisu
  • {%3} - całowita treść wpisu w postaci sformatowanego HTML
  • {%4} - link URL do wpisu
  • {%5} - rok publikacji danego wpisu
  • {%6} - miesiąc publikacji danego wpisu

Ja polecam następującą konfigurację pól wzorca pojedyńczego wpisu:

Item Title Template (tytuł wpisu): {%5}/{%6}/{%1}: {%2}
Item Link Template (link do wpisu): {%4}
Item Content Template (zawartość wpisu): {%3}

W zasadzie tytuł wpisu może być dowolną kombinacją zmiennych, ale ja wybrałem tę, gdyż ona zapewnia w miarę chronologiczną kolejność wpisów w kanale. Niestety nie jestem w stanie wyciągnąć dnia publikacji w postaci numerycznej, stąd identyfikator wpisu. Jednak to nie zawsze się sprawdza, gdyż czasem notka jest najpierw zapisana a opublikowana później niż inny, nowszy wpis. Ale to chyba drobiazg...
Po wypełnieniu tych pól (czwarte pozostaje wolne) wciskamy PREVIEW.


KROK 4 (Step 4)
Przycisk preview daje nam podgląd naszego kanału, jaki będzie widoczny w czytniku. Pozostało tylko zmienić nazwę kanału na jakąś bardziej przyjemną. Klikamy na link Change file name, wpisujemy jakąś własną i zapisujem poprzez Rename. Po tych czynnościach dostajemy gotowy kanał, którego link - Feed URL - kopiujemy do czytnika lub do przekazania innym czytelnikom. Drugi link - Edit URL - służy do ewentualnej edycji w późniejszym czasie i jest ważny dla tych, którzy go skonfigurowali nie zakładając konta. Posiadacze kont mają go zapisanego już w swoim profilu (AJAX działa!).
Opcjonalnie można dany kanał zabezpieczyć hasłem i/lub zmienić na prywatny, ale szczerze mówiąc nie testowałem tych opcji.


PODSUMOWANIE
W ten sposób można sobie przygotować do czytania dowolną ilość kanałów z dowolnych bloxów. Można też przygotować feed z własnego bloga i przekazać link do niego zainteresowanym czytelnikom. Można go też przerzucić jeszcze przez FeedBurnera, jak pochwalił się hippotam w pierwszym komentarzu i jak zrobiłem to ja. Dla chętnych: link do RSS mojego bloga z pełną zawartością. O samym FeedBurnerze napiszę już naprawdę po urlopie :)

Wykorzystanie opisanej przeze mnie metody pozostawiam już Waszej gestii. Macie jakieś pomysły (albo zastrzeżenia)?

del.icio.us icon , , , , ,
technorati icon , , , ,
poniedziałek, 16 lipca 2007, sgk

Polecane wpisy

  • usunięcie pomarańczowej "belki promocyjnej" bloxa

    Dziś rano na moich blogach zaskoczył mnie ( i nie tylko mnie ) taki widok: Nie mam pojęcia co to za pomysł, bo zapowiedzi administratorów nigdzie nie widziałem.

  • permalinki do komentarzy na blox.pl (user.js)

    W czasie gdy debergerac udoskonala swój skrypt do awatarów osób komentujących na blox.pl (ostatnio dodał awatary z blip.pl ) ja postanowiłem zająć się czymś, c

  • takie prace warto propagować

    Mimo, że kilka dni temu zrobiłem już o tym wzmiankę w minizapiskach , ale wciąż jestem pod wielkim wrażeniem graficznej doskonałości nowego projektu SenTineLa

TrackBack
TrackBack w tym blogu jest moderowany. TrackBack URL do wpisu:
blox, seo zmiany i pełny RSS z feed43.com z experymenty informatyczne
Niedawno administratorzy bloxa wdrożyli tzw. quot SEO zmiany quot w strukturze HTML blogów, które na razie są opcjonalne. Jednak niektórzy użytkownicy włączyli je już teraz i dostosowali szablony o czym sporo zostało napisane w BloxWiki . W ... »
Wysłany 2007/12/13 00:06:11
Komentarze
kosciak1
2007/07/16 13:44:19
Nie jestem pewny czy aby na pewno to jest najlepszy sposób na tworzenie kanału akurat dla blogów (zwłaszcza dosyć popularnych). Zacytuje za FAQ Feed43:
"Technical Questions
How often does Feed43 pulls data from the source web site?
[...] You are strongly recommended to obey this polling interval (see documentation on you news reader for controlling this behavior), otherwise your IP may be blocked temporarily or permanently, depending on the severity of abuse."

W wolnym tłumaczeniu:

"Jeśli nie będziesz się stosował do 6cio godzinnych przerw pomiędzy sprawdzaniami możemy zbanować twoje IP na stałe lub czasowo zależnie jak często będziesz sie do nas dobijać"

Czyli przepuszczając przez FeedBurnera może się zdarzyć, że zbanują FB :)
-
hippotam
2007/07/16 14:04:26
Kosciak1> Na szczęście nie. Zadałem wczoraj to pytanie supportowi Feed43. Miły pan odpisał, że spoko, bo interwał pollingu FeedBurnera jest "slightly above" granicy poniżej której banują.

Swoją drogą, lista zabanowanych IP podaje te graniczne częstotliwości:

* Request any of Feed43 feeds for 24 times in a 6-hour frame (approx. 1 request per 15 minutes), and you will see your IP in 'Banned Temporarily' list.
* Request any of Feed43 feeds for 180 times in a 6-hour frame (approx. 1 request per 2 minutes), and you will be added to our permanent hall of fame.
-
hippotam
2007/07/16 14:05:13
Wcięło linka: feed43.com/banned.htm
-
kosciak1
2007/07/16 14:44:05
24 razy w przeciągu 6 godzin. To jest niewiele. Wystarczy 5 osób, które sobie dodadzą feeda do jakiejś automatycznej listy sprawdzającej co godzinę czy jest coś nowego.
Ale w sumie nie ma co krakać. Zobaczy się "w praniu" czy się sprawdzi.
-
hippotam
2007/07/16 16:33:53
"Wystarczy 5 osób, które sobie dodadzą feeda do jakiejś automatycznej listy sprawdzającej co godzinę czy jest coś nowego. "
Dlatego trzeba go "zbramkować" FeedBurnerem, który ma interwał 30 minut. Ludzie pingujący często RSS-a dostaną feed z cache FB.
-
Gość: wentuq, *.informel.pl
2007/07/18 23:31:50
Dzięki, kawał dobrej roboty
-
a.dan.ti
2007/08/25 22:08:06
ja sobie poradziłam z datą tak :.. {*}WpisBox{*}DataWpisu">{%} {*}ItemTytul">{%} {%}{*}
{*}"IPTlinkuj" href="{%}">

w wolnej chwili pomyślę czy jest lepszy sposób...
-
sgk
2007/08/25 23:12:23
Ale wtedy data jest w postaci tekstowej typu "sobota, 25 sierpnia", prawda?
Numerycznej w stylu "2007-08-25" wg mojej wiedzy nie da się wydobyć, a to miałem na myśli...
-
a.dan.ti
2007/08/27 22:10:19
noo, z miesiącem jest ewidentnie problem... cóż, trudno.
-
sgk
2007/08/27 22:25:22
Problem jest raczej z dniem, bo miesiąc da się wyciągnąć z adresu URL notki, co też robię.
Natomiast numer dnia jest dostępny przy dacie w formacie tekstowym, gdzie najpierw jest nazwa dnia przyjmująca różne wartości, potem przecinek, spacja NUMER DNIA i przyjmująca różne wartości nazwa miesiąca. O ile do przecinka da się napisać wyrażenie, to po przecinku już nie, bo (jak na razie) feed43 nie pozwala manipulować ilością wycinanych znaków. Nie ma też nic na kształt wyrażeń regularnych...

Dlatego rozwiązaniem jest albo data w postaci tekstowej jak u Ciebie, albo używanie ID NOTKI, jak to proponuję (a używam w Thunderbirdzie jako chronologiczny backup bloga).
-
footszak
2007/09/09 09:17:49
Potwierdzam, kawał dobrej roboty. Mam tylko jedno pytanie finalne, bo nie mogę sobie poradzić z ogonkami - wpisałem encoding iso-8859-2, mimo to w feedzie zamiast polskich krzaczków są pytajniki: feed43.com/futrzakiewicz_fotoblog.xml
Dzięki z góry za ewentualne naprostowanie mojego neptyzmu :)
Pozdro
-
sgk
2007/09/10 09:46:20
Widzę, że sam "wyprostowałeś swój neptyzm" :)
Co było przyczyną braku polskich liter i jak się to naprawiło?
-
footszak
2007/09/10 10:34:34
Przyczyną było to, że nie miałem konta na f43. Z tego co pamiętam podczas rejestracji konta wybiera się w którymś momencie język i najprawdopodobniej to rozwiązało problem. Wniosek: warto się zarejestrować. Dzięki jeszcze raz i pozdro
-
beaviz
2007/12/09 20:36:16
Witam ! Wspaniała robota :) Przyczyną, że nie ma polskich ogonków jest mały błąd w artykule... kodowanie powinno byc iso-8859-2 (przy rejestracji konta feed43 nie pyta się o język).
-
sgk
2007/12/09 23:17:23
Witam, dzięki za dobre słowo i wychwycenie literówki - tyle razy to czytałem i za każdym razem mi umykało ;)
-
cynthia76
2009/01/08 01:03:35
Wracam do starego tematu.
Na flikr nie znalazłam rss do strony z wynikami wyszukiwania. Czy da się to zrobić w feed43? Jeśli tak to jak? Próbowałam ale nie wychodzi.
Strona z której chcę mieć feed to flickr.com/search/?q=green
-
sgk
2009/01/11 23:58:44
@cynthia
Wygląda na to, że dałoby się to zrobić w f43 - struktura wyników wyszukiwania wygląda na stałą/powtarzalną. Niestety nie mam w tej chwili czasu, aby bardziej Ci pomóc.

A czy RSS z tagu green daje zawartość mniej satysfakcjonującą niż wynik wyszukiwania green? Śledzenie takich tagów nieźle działa w widżecie Flickr na netvibes...
-
cynthia76
2009/01/12 16:02:05
Dziękuję, ten rss wystarczy, nie zauważyłam tego.
bloxowe porady

RSS


dodaj do netvibes

Add to Google


pobierz Spiceworks - darmowe oprogramowanie do zarządzania infrastrukturą IT