Long whitespace after a string? How to detect it?

Hi,

I have a dataset about comments and I face with the following issue: Some strings are followed with a long a whitespace series (or I dont know why I see that), and some doesn not: I enclose the pic

As you see there is always a huge whitespace series after elements, except the first one. Do you know if this can be detected, because it truly correspond to the string I want to omit.

Thanks for you help in advance,
M

We reallymneed more information about where the data is coming from, what analyses you want to do on it and what are the results expected. In particular, we need your code and some sample data.

For some suggestions have a look at

and

Sorry I cant enclose the data by RData and by data.pasta it loses this behavior. So my q is that what is reason why you see a lot empty lines after some string and not after some. I want to remove from the vector those, who are not followed with empty lines after

load("C:/school/szem_8/TDK-airbnb/airbnb-research/sample.RData")
print(x)
#> [1] "Gyomaendrőd szívében, közvetlenül a Kner-emléktér mellett, igényesen felújított épületben  felszerelt konyhával, külön fürdőszobával, WC-vel rendelkező, központi fűtéses apartman. A parkosított udvarban főzési, grillezési lehetőség adott. Az épülettől 200 m-re helyezkedik el a Liget-fürdő nyitott medencékkel és fedett uszodával,  szaunával. Kb. 300 m-re az élő Hármas-Körös, a közelben pedig fürdésre, horgászásra, pihenésre alkalmas holtágai.A közelben számos étterem található.A helyApartmanunkat az teszi különlegesé, hogy a város központjában helyezkedik el ugyan, de a hatalmas kert miatt ideális, csendes pihenőhely.Mit használhatnak a vendégek?Az apartmanoknak saját teraszuk van, de ezen kívül minden vendég használhatja  az egész udvart, a kerti bútorokat, grillezőhelyet. A kertben számos gyümölcsfa, bokor található, folyamatosan érnek az ízletes gyümölcsök , a friss zöldségek,amelyeket a vendégek is fogyaszthatjákEgyéb fontos dolgokA vendégek biztonsága érdekében munkanapokon 16 óra után és hét végén, ünnepnapokon a  nagykaput zárva tartjuk."
#> [2] "Gyomaendrőd szívében, közvetlenül a Kner-emléktér mellett, igényesen felújított épületben  felszerelt konyhával, külön fürdőszobával, WC-vel rendelkező, központi fűtéses apartman. A parkosított udvarban főzési, grillezési lehetőség adott. Az épülettől 200 m-re helyezkedik el a Liget-fürdő nyitott medencékkel és fedett uszodával,  szaunával. Kb. 300 m-re az élő Hármas-Körös, a közelben pedig fürdésre, horgászásr… bővebben"                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           
#> [3] "A háztulajdonos  rugalmasan alkalmazkodott késői érkezésünkhöz."                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
#> [4] "Környékünkön nagyon sok a zöld terület,  az épületünkből  rá lehet látni az Erzsébet Ligetre és a Falualjai  holtágra. A Liget Fürdő a közvetlen közelünkben van. A Hármas - Körös és annak partja ideális kirándulásra, szárazföldi és vízi sportokra. Nemzeti Park , túraútvonal van a környékünkön, ahol megcsodálhatjuk a a napról-napra változó természet szépségét.  Városunk  folyamatosan  épül, szépül a folyamatos felújításoknak köszönhetően."                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          
#> [5] "Környékünkön nagyon sok a zöld terület,  az épületünkből  rá lehet látni az Erzsébet Ligetre és a Falualjai  holtágra. A Liget Fürdő a közvetlen közelünkben van. A Hármas - Körös és annak partja ideális kirándu… "                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               
#> [6] "Házi gyermekorvosként dolgozom, emellett üzemeltetem az apartmant. Szeretek utazni, elsősorban a tengerpartokat kedvelem, de a hegyeket is kedvelem. Szívesen hallgatok zenét és olvasok könyveket. Igyekszem a vendégeink pihenését, üdülését minél kényelmesebbé, kellemesebbé tenni."                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            
#> [7] "Házi gyermekorvosként dolgozom, emellett üzemeltetem az apartmant. Szeretek utazni, elsősorban a tengerpartokat kedvelem, de a hegyeket is kedvelem. Szívesen hallgatok zenét és olv… bővebben"                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     
#> [8] "A háztulajdonos  rugalmasan alkalmazkodott késői érkezésünkhöz."

Created on 2021-03-06 by the reprex package (v0.3.0)

Sorry as I see even with reprex you see other thing, thats why I enclosed the pc

Hi Marcell,

I agree with jrkrideau and I'm wondering if you want to omit the whole line or only the extra whitespaces?

Assuming you want the latter, you could make use of str_trim() of the stringr package.

library(stringr)

text <- c("Lorem ipsum dolor sit amet, consectetur adipiscing elit,                     ",
          "           sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.",
          " Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi  ",
          " ut aliquip ex ea commodo consequat.                                      "
          )

text
#> [1] "Lorem ipsum dolor sit amet, consectetur adipiscing elit,                     "
#> [2] "           sed do eiusmod tempor incididunt ut labore et dolore magna aliqua."
#> [3] " Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi  "   
#> [4] " ut aliquip ex ea commodo consequat.                                      "

str_trim(text, side = "both")
#> [1] "Lorem ipsum dolor sit amet, consectetur adipiscing elit,"               
#> [2] "sed do eiusmod tempor incididunt ut labore et dolore magna aliqua."     
#> [3] "Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi"
#> [4] "ut aliquip ex ea commodo consequat."

Created on 2021-03-06 by the reprex package (v1.0.0)

I know, but the whitespace is out of the string. Please watch the picture about the console. I highlited the second elemnt: The string ends with a " character, but on the console extra lines appear, while you cant see similar thing in the case of the first element.

Ah, it's not so much about the whitespaces in the string, but the whitespaces in the console. And indeed, the reprex below is not showing that behavior, but now anyone can recreate it easily with this example.

text <- c("Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.",
          "Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo. Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt. Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam quaerat voluptatem. Ut enim ad minima veniam, quis nostrum exercitationem ullam corporis suscipit laboriosam, nisi ut aliquid ex ea commodi consequatur? Quis autem vel eum iure reprehenderit qui in ea voluptate velit esse quam nihil molestiae consequatur, vel illum qui dolorem eum fugiat quo voluptas nulla pariatur?",
          "Lorem ipsum dolor sit amet",
          "Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium"
          )
text
#> [1] "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum."                                                                                                                                                                                                                                                                                                                                                                                                                                    
#> [2] "Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium, totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae dicta sunt explicabo. Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt. Neque porro quisquam est, qui dolorem ipsum quia dolor sit amet, consectetur, adipisci velit, sed quia non numquam eius modi tempora incidunt ut labore et dolore magnam aliquam quaerat voluptatem. Ut enim ad minima veniam, quis nostrum exercitationem ullam corporis suscipit laboriosam, nisi ut aliquid ex ea commodi consequatur? Quis autem vel eum iure reprehenderit qui in ea voluptate velit esse quam nihil molestiae consequatur, vel illum qui dolorem eum fugiat quo voluptas nulla pariatur?"
#> [3] "Lorem ipsum dolor sit amet"                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       
#> [4] "Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium"

Created on 2021-03-06 by the reprex package (v1.0.0)

Well, this is not specific to the RStudio console, as this behavior can also be seen when running it in the R console.

But on the console I also see new lines. Why is it?

I've found this answer on stackoverflow: print(as.list(text))

This topic was automatically closed 7 days after the last reply. New replies are no longer allowed.

If you have a query related to it or one of the replies, start a new topic and refer back with a link.