Treść / Treść:
  • Dlaczego potrzebne jest generowanie tekstu?
  • Powielanie artykułów – co to jest?
  • Podstawowe konstrukcje generatorów
  • Jakie algorytmy służą do oceny tekstu
  • Jaka jest różnica pomiędzy szablonami produktów i artykułów?
  • Jak stworzyć swój pierwszy szablon
  • Najczęstsze błędy przy tworzeniu szablonów i mnożeniu artykułów

Generowanie tekstu to proces, który pozwala uzyskać z jednego szablonu wiele innych tekstów spełniających zadane warunki. Dobrym przykładem jest dowolny istniejący CMS (system zarządzania treścią) taki jak Joomla, WordPress, OpenCart i inne. Pewna strona „statyczna” pełni rolę szablonu, do którego wstawiane są istniejące informacje z bazy danych. Przykładowo dla karty produktu w sklepach internetowych informacją jest opis, bloki, atrybuty, opcje itp. W witrynach z artykułami informacje obejmują teksty artykułów, dane publikacji, powiązane bloki i tak dalej. Takie podejście pozwala znacznie skrócić czas spędzony na wsparciu serwisu.

Jednak tworzenie tekstu nie ogranicza się do tego przykładu. Proces ten obejmuje także generowanie tekstów pseudounikalnych. Ale o wszystko w porządku.

Dlaczego potrzebne jest generowanie tekstu?



Jak zapewne już zrozumiałeś, dziś prawie każda witryna jest produktem procesu generowania tekstu. Istnieją jednak obszary, w których generowanie jest minimalne, takie jak witryny z artykułami, gdzie główny tekst na każdej stronie artykułu jest napisany przez człowieka i jest niepowtarzalny (stosunkowo unikalny). Są też obszary, w których po prostu nie da się obejść bez wygenerowania tekstu głównego, gdyż pisanie ciekawych i zaskakujących tekstów w każdym przypadku jest po prostu nieuzasadnione (zajmie to zbyt dużo czasu, a wynik będzie minimalny). Takimi przykładami są katalogi programów, sklepy internetowe, promocje artykułów i inne.

Wyobraź sobie, że masz 1000 produktów, które są praktycznie identyczne, a mają tylko kilka parametrów. Napisanie 1000 unikalnych artykułów jest po prostu niemożliwe. Każdy, kto chociaż raz napisał normalny artykuł, wie, że może to zająć średnio od godziny do nieskończoności. Prosta matematyka. Jeśli będziesz pisać 8 artykułów dziennie, z czego każdy zajmie Ci co najmniej godzinę razem z projektem, będziesz potrzebować około 125 dni. Ponad jedną trzecią roku, którą można przeznaczyć na coś pożyteczniejszego.

Jednak ważne jest, aby zrozumieć, że generowanie tekstu oznacza dokładność i przemyślane wykorzystanie, ponieważ wyszukiwarki nie mają na celu zaśmiecania wyników. Wynik będzie zależał od podejścia do procesu. Pozycje wyszukiwania witryny mogą wzrosnąć, ruch może wzrosnąć, czynniki behawioralne mogą się poprawić i tak dalej. A może wręcz przeciwnie, doprowadzi to do stosowania filtrów przez wyszukiwarki do GUS i innych.

W przyszłości generowanie tekstu będzie oznaczać tworzenie tekstów podstawowych z jednego szablonu.

Powielanie artykułów – co to jest?

Obecnie istnieje ponad miliard witryn internetowych. Pomyśl tylko o tej liczbie. A na każdym z nich jest znacznie więcej niż jedna strona. Wyszukiwarki muszą uszeregować wszystkie te witryny w wyszukiwarce według tej samej liczby zapytań (w kolejności). Zadanie jest niezwykle obszerne. Dlatego pod uwagę bierze się wiele czynników, których stale przybywa. Na przykład liczba niezbędnych linków do witryny, aby uzyskać określony TIC, rośnie z roku na rok.

Z tego i innych powodów, jeśli chodzi o promocję i generowanie stron w serwisie, dużą popularność zyskał proces „Mnożenia artykułów”, który przy wystarczających umiejętnościach pozwala dosłownie uzyskać setki pseudo-unikalnych artykułów w godzina. Inaczej mówiąc, o artykułach, które są unikalne z punktu widzenia wyszukiwarek, ale podobne z punktu widzenia człowieka.

Co należy rozumieć przez powielanie artykułów? W uproszczeniu proces składa się z kilku etapów:

  1. Pisanie zwykłego artykułu
  2. Wstawianie specjalistycznych konstrukcji, które pozwalają na modyfikację tekstu
  3. Określa parametry oceny podobieństwa i liczbę wymaganych artykułów
  4. Pokolenie

Ci, którzy często zajmują się reprodukcją tekstów, zwykle od razu piszą szablony i korzystają z zachowanych konstrukcji z innych szablonów. Jeśli jednak dopiero zaczynasz zajmować się generacją to zdecydowanie nie radzę Ci od razu zajmować się szablonami. Trzeba „poczuć” ten proces w praktyce. Z biegiem czasu, gdy już opanujesz, dobrze wykonany szablon pozwoli Ci szybko uzyskać odpowiednią liczbę artykułów, z których każdy nie będzie do siebie podobny.

Jednocześnie warto zrozumieć, że w świecie, w którym przepisywania i duplikaty w wynikach wyszukiwania są zjawiskiem normalnym, reprodukcja artykułów jest procesem całkowicie naturalnym (nie jest to ani złe, ani dobre, po prostu jest tak, jak jest).

Ważne jest również, aby zrozumieć, że reprodukcja płci nie jest panaceum i proces ten powinien być stosowany ostrożnie. Ponadto same artykuły muszą być czytelne dla człowieka. Ale więcej szczegółów na temat błędów pod koniec artykułu.

Podstawowe konstrukcje generatorów

Wiele programów lub generatorów witryn prezentuje własny zestaw unikalnych projektów, ale najczęściej spotykane są projekty podstawowe.

Jest ich kilka, rozważmy je najpierw:

1. Synonimizacja . Termin ten odnosi się do procesu zamiany słów na słowa o podobnym znaczeniu lub po prostu losowego podstawienia (nie ma tu jasnego kryterium). Sama konstrukcja to otwierający nawias klamrowy „ { ”, po którym następują słowa lub zdania oddzielone poziomą linią „ | ”, a na końcu zamykający nawias klamrowy „ } ”.

Rozważ następujący wzór:

1. Вы получите этот товар вместе с { скидкой | подарком | акцией | 10%-й бонусной картой}

Na wyjściu losowo pojawią się następujące linie:

1. ...
2. Вы получите этот товар вместе с скидкой
3. Вы получите этот товар вместе с 10%-й бонусной картой
4. Вы получите этот товар вместе с подарком
5. Вы получите этот товар вместе с акцией
6. ...

Jak widać, używając tej konstrukcji do zamiany słów lub zdań, można uzyskać różne teksty. Ponadto warto wiedzieć, że takie konstrukcje można stosować także wewnątrz siebie, aby zaoszczędzić miejsce, aby nie powtarzać tych samych zwrotów, które różnią się tylko jednym słowem.

Ponieważ początkowo takie konstrukcje służyły do zastępowania wyrazów synonimami, wiele programów i usług służących do synonimizacji i reprodukcji posiada własne, gotowe bazy takich konstrukcji. Z tego powodu w zasadzie całkowicie unikalne teksty można uzyskać od razu po zainstalowaniu programu, choć trzeba będzie je sprawdzić ręcznie, gdyż automatyczna zamiana tekstu czasami prowadzi do powstania tekstów „urojeniowych”.

2. Permutacja . Taka konstrukcja umożliwia mieszanie słów i wyrażeń. Występuje w prawie wszystkich programach i usługach do generowania tekstu, ale jego obecność nie jest obowiązkowa. Zmiana kolejności jest bardzo przydatna, gdy trzeba zmienić kolejność zdań lub opisów czegoś. Konstrukcja jest podobna, ale z pewnymi różnicami. Rozpoczyna się nawiasem kwadratowym „ [ ”, następnie poprzez poziomą ramkę „ | ” wskazuje słowa i wyrażenia, które mają zostać permutowane, a na końcu znajduje się zamykający nawias klamrowy „ ] ”. Ważna uwaga. W zależności od wersji programów i usług konstrukcje te można nieco zmodyfikować, np. dodano możliwość określenia symboli lub słów, które będą separatorami, tak aby nie były one wymieniane.

Rozważmy przykład:

1. Эта программа позволяет [ просматривать видео, | прослушивать аудио, | вставлять комментарии,] редактировать подсветку

Na wyjściu będziesz mieć następujące losowe frazy:

1. ...
2. Эта программа позволяет просматривать видео, прослушивать аудио, вставлять комментарии, редактировать подсветку
3. Эта программа позволяет прослушивать аудио, вставлять комментарии, просматривать видео, редактировать подсветку
4. Эта программа позволяет просматривать видео, вставлять комментарии, прослушивать аудио, редактировать подсветку
5. ...

Jak widać za pomocą tej konstrukcji można uzyskać stosunkowo różne fragmenty tekstu. Ważne jest, aby zrozumieć, że na zmianę układu tekstu wpływa również podobieństwo tekstów, choć najczęściej zmienia się samo znaczenie.

Rozważmy teraz kilka specjalistycznych projektów:

1. Wstawienie . Jeśli masz jakieś puste miejsca lub informacje, które można pobrać z dowolnej bazy danych, można je wykorzystać za pomocą konstrukcji wstawiania. Zwykle wstawką jest jakieś specjalistyczne słowo, po prawej i lewej stronie którego znajdują się nawiasy lub ich kombinacje. Na przykład „ [imię] ”, „ {rodzina} ”, „ [nick] ” i inne. Format różni się w zależności od programu, ale treść jest zwykle taka sama.

Rozważmy przykład. Załóżmy, że musisz wygenerować teksty dla użytkowników:

1. Уважаемый [name], пожалуйста, подтвердите ваш заказ с номером [order_num]

Przy wyjściu każdego użytkownika otrzymasz SMS-y w postaci:

1. ...
2. Уважаемый Василий, пожалуйста, подтвердите ваш заказ с номером №123
3. Уважаемый Проськин, пожалуйста, подтвердите ваш заказ с номером №444
4. ...

Jak już zapewne się domyślasz, takie wstawki są szczególnie przydatne, gdy w magazynie występuje duża ilość danych tego samego typu, np. produktów tej samej kategorii, programów w katalogach itp.

2. Funkcje warunkowe . Są to wyspecjalizowane konstrukcje, które pozwalają logicznie obliczyć, jaki tekst wstawić (lub nie wstawić). Na przykład funkcje sprawdzające wartości: jeden, większe niż, mniejsze niż itp. Format tych funkcji jest unikalny w każdym generatorze, dlatego nie można ich wyliczyć. Są one jednak bardzo przydatne w przypadkach, gdy szablon jest skomponowany dla różnych, różniących się od siebie obszarów. Jednak takie funkcje są dość rzadkie.

Jakie algorytmy służą do oceny tekstu

Do oceny podobieństwa tekstu wykorzystuje się wiele algorytmów. Ale najbardziej znane z nich to bezpośrednie porównanie i metoda gontowa. Są inne, ale zazwyczaj te dwa są więcej niż wystarczające do większości typowych zadań.

1. Bezpośrednie porównanie . Jak sama nazwa wskazuje, odnosi się to do stopnia, w jakim teksty okazały się identyczne. Jednocześnie ważne jest, aby zrozumieć, że jeśli umieścisz słowo na początku tekstu, nie sprawi to, że będzie on wyjątkowy. Ponieważ reszta będzie pasować całkowicie. Zaletą tej metody jest to, że jest łatwa do zrozumienia, a wadą jest to, że jest słabym wskaźnikiem z punktu widzenia wyszukiwarek. Możesz na przykład po prostu zmienić kolejność fragmentów tekstu i otrzymasz unikalny artykuł, ale wyszukiwarka nie odbierze go jako unikalnego.

2. Metoda gontowa . Algorytm ten jest jedną z metod oceny tekstu przez wyszukiwarki. Nie jest on kompletny, ale wyszukiwarki nie starają się ujawniać swoich algorytmów, aby utrzymać wyniki w normalnym stanie. Jednak ta metoda jest często stosowana do oceny podobieństwa tekstu i daje mocne wyniki.

Jego istotą jest podanie kilku kolejnych słów. Następnie cały tekst jest rozbijany na fragmenty o tej liczbie słów. Jednocześnie przesunięcie nie następuje o określoną liczbę słów, ale o jedno słowo za każdym razem. Powstałe półpasiec jest szyfrowany w sposób oszczędzający miejsce. Później oba teksty porównuje się właśnie pod względem liczby półpasiec, a nie tekstu. Takie podejście neguje permutację zwrotów i zdań w tekście, ponieważ fakt, że zamieniłeś dwa zdania, półpasiec praktycznie się nie zmieni.

Rozważ tekst.

1. Цена товара составляет Х с учетом акции.

Weźmy na przykład liczbę słów równą 3. W tym przypadku uzyskamy półpasiec

1. Цена товара составляет
2. товара составляет Х
3. составляет Х с
4. Х с учетом
5. с учетом акции.

Teraz, jeśli przesuniesz część „Z promocją”, dodasz słowa i otrzymasz „W przypadku promocji cena super artykułu wynosi tylko X”, to wyrażenie nadal będzie miało pewien procent podobieństwa, ponieważ niektóre półpasiec występuje. Po przetestowaniu pod kątem bezpośredniego dopasowania te dwie propozycje byłyby praktycznie różne.

Ważne jest, aby zrozumieć, że jest to prosty przykład i że istnieje wiele odmian metody gontowej. Czyszczenie ze słów stop - słów niemających charakteru informacyjnego, takich jak przyimki „w”, „na” i tak dalej. Zakończenia są odrywane od słów. Kolejność słów w gontach może mieć znaczenie lub nie. Słowa są oceniane łącznie z synonimami. I tak dalej.

Dlatego podczas komponowania tekstu bardzo ważne jest parafrazowanie zdań, wypełnianie ich niestandardowymi wstawkami i wyrazami, dodawanie lub wręcz przeciwnie usuwanie akapitów z tekstem, aby rozrzedzić półpasiec. Ogólnie rzecz biorąc, urozmaicaj tekst.

Jaka jest różnica pomiędzy szablonami produktów i artykułów?

Jeśli wyszukiwarki stawiają artykułom dość wysokie wymagania, to wymagania te sprowadzają się do opisów produktów. Powody są proste. Produkty są w większości takie same w sklepach internetowych konkurencji. Liczbę produktów łatwo obliczyć w tysiącach. Nie każdy potrzebuje arkuszy tekstowych, wielu kieruje się ceną i cechami. W zasadzie trudno jest sprawić, aby opisy produktów bardzo się od siebie różniły, przypomnijmy początek artykułu, w którym opisałem, ile czasu zajęłoby skompilowanie 1000 artykułów dla każdego produktu.

Ustępstwa w opisach produktów są zazwyczaj następujące:

  • Obniżono kryterium minimalnej liczby znaków w tekście (według różnych danych minimalna liczba to od 300 do 1000 znaków, w dzisiejszych artykułach próg ten wynosi 1500-2500)
  • Wyszukiwarki łatwiej radzą sobie z powielaniem treści (nie tylko na różnych stronach, ale także w obrębie tej samej witryny, np. podobne produkty z podobnym opisem)
  • Wyszukiwarki skupiają się bardziej na innych wskaźnikach i indywidualnych danych, takich jak słowa kluczowe (producenci, specyfikacje, model itp.)

Nie oznacza to oczywiście, że nie należy podchodzić do sprawy przy tworzeniu szablonów produktów. Ważne jest tylko, aby zrozumieć, że łatwiej jest tworzyć szablony do generowania tekstów produktowych i wiele można wyciągnąć z cech i metadanych samego produktu.

Jak stworzyć swój pierwszy szablon

Przede wszystkim, jeśli tworzysz szablon strony internetowej lub sklepu internetowego, musisz wykonać jego kopię zapasową. Na pisanie szablonów zawsze będziesz miał czas, jednak po eksperymentach odtworzenie opisu setek produktów jest bardzo trudnym zadaniem. Następną rzeczą, którą musisz wiedzieć, jest to, że jeśli nigdy wcześniej nie tworzyłeś wzorów, zacznij od małych zleceń lub małych kwot. Nie należy przyjmować od razu wszystkich produktów znajdujących się na stronie. Najpierw trzeba zobaczyć na własne oczy jak to wygląda i jaki jest efekt.

Teraz, po ostrzeżeniach, przejdźmy do małego algorytmu tworzenia pierwszego szablonu:

1. Otwórz wyszukiwarkę, wyszukaj tam opisy podobnych produktów i artykułów. Na podstawie tych danych napisz swój artykuł, tylko dobry, a nie jak dwie krople wody na źródłach.

2. Zaczynasz wypełniać tekst specjalistycznymi konstrukcjami, takimi jak synonimizacja, permutacja, wstawienie, funkcje warunkowe (zobacz, które są dostępne).

3. Przeprowadź generowanie tekstu.

4. Sprawdź, jak wyjątkowe są teksty. Możesz skorzystać z programów lub witryn objętych prawami autorskimi, których jest mnóstwo w Internecie. Jeśli używasz metody gontowej do sprawdzania programów, powinieneś ustawić liczbę słów w przedziale 5-7, najlepiej 5, ale nie zawsze jest to odpowiednie.

5. Jeżeli procent podobieństwa jest mniejszy od pożądanego, wróć do kroku 2 i przerób szablon jeszcze raz (dodaj go, zmień części itp.). Jeśli mierzysz za pomocą analizatorów, pożądane jest, aby odsetek ten był nie mniejszy niż 80%. Jeśli „na oko”, spróbuj spojrzeć na podobne sklepy na górze wyników wyszukiwania, aby zobaczyć, jak podobne są ich opisy produktów. To drugie oczywiście przestało być standardem, bo wyszukiwarki tworzą wynik wyszukiwania, ale przynajmniej jest to punkt odniesienia.

6. Otrzymujesz gotowy szablon. Pamiętaj, aby go gdzieś zapisać.

Na początku szablony nie będą tworzone szybko, ale gdy już to opanujesz, tworzenie szablonów nie zajmie dużo czasu.

Najczęstsze błędy przy tworzeniu szablonów i mnożeniu artykułów

A teraz warto poznać najczęstsze błędy początkujących przy tworzeniu szablonów i mnożeniu artykułów, aby uniknąć jak największej liczby raków:

  • Zrobię uniwersalny szablon na każdą okazję w życiu . Faktycznie może tak być i rezultaty mogą być dobre, jednak dla początkujących lepiej jest tego na początku nie robić. Jakie są tutaj pułapki. Pierwszy. Wzór będzie rósł i będziesz się mylić w projektach. Nie patrz na przykłady, które były w artykule. Zwykle wzory są czymś w rodzaju chaosu symboli i pojedynczych wzorów. Drugi. Jeśli zmienisz zapotrzebowanie na część tekstów, będziesz musiał albo jeszcze bardziej skomplikować szablon, albo skopiować i zmodyfikować ten uniwersalny szablon. Trzeci. Jeśli masz trochę doświadczenia, łatwo jest zignorować kontekst i uzyskać czytelny, ale pozbawiony znaczenia tekst. Ogólnie rzecz biorąc, na początkowych etapach będzie znacznie więcej problemów.
  • I wezmę gotową bazę synonimów . Można używać bazy synonimów, ale nie bezmyślnie. Wszystkie takie teksty należy po wygenerowaniu sprawdzić pod kątem czytelności. „A twój produkt mleczny szybko się rozszedł” nie jest frazą z kreskówki o Carlsonie.
  • Zaraz zrobię szablon . Tego trzeba się jeszcze nauczyć - widzieć tekst zgodnie z szablonem. Początkujący zacznie się mylić w połowie tekstu i nie będzie rozumiał, jaki rodzaj tekstu tworzy. W rezultacie szablon będzie musiał nie tylko zostać doprowadzony do pożądanego procentu podobieństwa, ale także utworzyć z niego tekst.
  • Upycham frazy kluczowe i inne triki . Pamiętaj, że powielane teksty muszą odpowiadać normom tekstów SEO. Fakt, że artykuły okazały się unikalne oznacza, że normalnie trafią one do wyników wyszukiwania. Dlatego w ten sam sposób zwracaj uwagę na inne aspekty SEO. Nie przesadzaj np. ze słowami kluczowymi, używaj wpisów pośrednich itp.
  • Wymyśliłem coś innego, zregeneruję cały asortyment . Pamiętaj, że częste zmiany tekstu, zwłaszcza w dużych ilościach, to sygnał dla wyszukiwarek. Dodatkowo, jeśli w szablonach zastosowana zostanie synonimizacja, za każdym razem zostaną podstawione losowe słowa i frazy, co spowoduje zmianę tekstu. Spróbuj podejść do tego pytania w sposób przemyślany. Przykładowo, jeśli chcesz dodać coś na końcu tekstów, to sprawdź, czy w Twoim generatorze nie ma możliwości stworzenia takiego szablonu, który najpierw wstawi istniejący tekst, a dopiero potem doda swój pomysł. Takie zmiany w tekstach są dużo łatwiej traktowane przez wyszukiwarki, gdyż wiadomo, że z biegiem czasu dowolne opisy można uzupełniać (ale nie zostaną one całkowicie zmienione, zwłaszcza przy użyciu synonimów).
  • Mniej więcej od razu po wygenerowaniu według jednego szablonu ruch gwałtownie wzrósł, szybko zrobię inne . Ważne jest, aby zrozumieć, że proces oceny tekstów i witryn w wyszukiwarkach jest dość powolny. Jest zatem całkiem możliwe, że wzrost był powiązany z czymś innym. Nie spiesz się, aby uruchomić wszystkie teksty na raz, szczególnie jeśli nie jesteś pewien co do szablonów. Obserwuj, co się dzieje. Radzę również, aby przy pierwszych oznakach upadku nie próbować od razu wycofywać wszystkiego. Po zmianie problemu można zaobserwować chwilowy spadek ruchu na stronie.

Teraz wiesz więcej na temat generowania tekstu i reprodukcji artykułów, jesteś ostrzegany o wielu problematycznych miejscach i znasz różne subtelności.


Powiązane towary