[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je.
From: |
Paweł Różański |
Subject: |
Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je. |
Date: |
Wed, 01 Sep 2010 08:45:31 +0200 |
User-agent: |
Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.1.11) Gecko/20100805 Icedove/3.0.6 |
On 31.08.2010 15:23, Jan Owoc wrote:
JO>> Podsumowując dyskusję zdecydowaliśmy, że wstawianie spacji
JO>> niełamliwych jest pożądane. Teraz debatujemy nad najbardziej
JO>> efektywnym sposobem ich wstawiania.
Nadinterpretujesz. Dopuszczamy możliwość użycia jeśli nie powoduje
to spadku czytelności oryginalnego tekstu i możliwości stosowania
automatycznego sprawdzania pisowni.
Zrozumiałem, że doszliśmy do wniosku, że wstawianie nbsp jest czymś
pożądanym. Skupmy się na tym jak to najlepiej zrobić.
Błędnie zrozumiałeś. "Skoro już ktoś chce, żeby wstawiać, to róbmy to
możliwie w najmniej przeszkadzający sposób" != "wstawianie jest pożądane".
Dwie faktycznie odpadają, ale przy 3-4 spacjach jest znacznie lepiej.
Postaram się zrobić wieczorkiem pełne statystyki. Nawiasem, 3 lub 4 spacje
nie powinny występować w oryginale (dwie wiemy, że występują) - formatowanie
tekstu spacjami jest (niekrytycznym) błędem.
Czy wyobrażasz sobie, aby tłumacz siedział z tabelką przyimków i
systematycznie wstawiał dokładnie 4 spacje po każdym? Dodatkowe spacje
są usuwane przez przeglądarki, więc 4 spacje mają tą samą szerokość co
jedna.
W edytorach PO wielokrotne spacje są widoczne, tłumacze pracują raczej
na nich, niż przeglądarkach. IMO 3 (cztery nie wydają się konieczne)
spacje są mniej problematyczne, niż rozwalający wszystko
Niestety, nie da się tego sensownie wykorzystać 3 i więcej spacji.
Nawet przyjmując zasadę "nie spacja i nie cudzysłów, następnie 3 spacje,
następnie nie spacja" mamy 7 plików pot z takim ciągiem. Przy czterech
spacjach ta liczba spada do 3 plików, ale to niewiele zmienia. Chyba,
żeby robić drobne zmiany w treści, albo napisać omijanie treści zawartej
w <pre> (to już nietrywialne)...
Jakby ktoś chciał zweryfikować:
Dla 3 (dla 4 spacji należy {3} zmienić na {4}:
- szukanie linii:
egrep -iR "[^ \"]\s{3}\S" *
- ilość plików
egrep -iR "[^ \"]\s{3}\S" * | awk -F ':' '{print $1}' | sort -u | wc -l
JO>> Jeśli ktoś dobrze znający sed napisałby filtr, który wyszukałby
JO>> spójników i przyimków:
JO>> http://pl.wikipedia.org/wiki/Sp%C3%B3jnik_%28cz%C4%99%C5%9B%C4%87_mowy%29
JO>> http://pl.wikipedia.org/wiki/Przyimek
JO>> to mógłbym go stosować tuż przed wysłaniem pliku na serwer gnu.
Mogę skrobnąć skrypt do tego, ale potrzebuję dokładnych wytycznych (warunki
wstawiania, kiedy wstawiać, kiedy nie wstawiać). Proponuję w Perlu, bo po
pierwsze więcej da się zrobić, można używać warunków, ściągać plik ze strony
(np. w celu weryfikacji, czy ma wstawione OK) i ma normalne wyrażenia
regularne (PCRE), a nie tę imitację, która jest w sed.
Czy jesteś w stanie napisać skrypt w Perlu, który by szukał spójnika
lub przyimka (lista spójników i przyimków na Wikipedii) nie
uwzględniając wielkości liter. Jeśli po spójniku/przyimku jest jedna
lub więcej spacja, zamienić spacje na ciąg znaków " "
Jestem (przy wstawianiu "na pałę" jest to wręcz trywialne), ale takie
podejście to typowy przykład, że "Każdy złożony problem ma proste,
błędne rozwiązanie".
Po pierwsze, lista spójników i przyimków na wiki nie jest kompletna.
Po drugie, nie jestem przekonany, że chcesz dawać   po takich
spójnikach jak: tudzież, aczkolwiek, jednak, natomiast, mianowicie,
jeżeli, ponieważ. Po trzecie, wspomniane teksty w <pre>.
Niemniej, w weekend postaram się skrobnąć coś, co ew. da się potem
rozwinąć do większej ilości reguł i wyjątków, oraz pozwoli na łatwe
modyfikacje reguł.
Możemy te rzeczy robić równolegle. Jeśli znasz Perl, napisanie skryptu
powinno być dość proste.
J.w. Będzie w weekend. Nie tyle napisanie jest problemem, co zrobienie
wersji w miarę elastycznej.
Odnośnie edytora, możemy przecież dodać odwrotny skrypt do tego, który
informuje o aktualizacjach; wersje w www-pl będą zawsze bez znaku
nbsp.
Jak pisałem, nie chodzi mi tyle o obecność nbsp czy jego brak, tylko o
wygodę tłumaczenia. Jeśli w repo będą wersje bez nbsp (co nigdy nie jest
błędem), to nie ma dla mnie znaczenia, co trafi na WWW.
Pozdrawiam,
Paweł
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je.,
Paweł Różański <=
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je., Paweł Różański, 2010/09/02
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spacje., Sylwester Zarębski, 2010/09/02
- Re: [www-pl-discuss] NBSP; czyli niełamliwe s pacje., Paweł Różański, 2010/09/03
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spacje., Jan Owoc, 2010/09/03
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je., Paweł Różański, 2010/09/03
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spacje., Jan Owoc, 2010/09/03
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je., Paweł Różański, 2010/09/04
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spacje., Jan Owoc, 2010/09/06
- Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je., Paweł Różański, 2010/09/09