split a row into 2 rows
이 질문을 팔로우합니다.
- 팔로우하는 게시물 피드에서 업데이트를 확인할 수 있습니다.
- 정보 수신 기본 설정에 따라 이메일을 받을 수 있습니다.
오류 발생
페이지가 변경되었기 때문에 동작을 완료할 수 없습니다. 업데이트된 상태를 보려면 페이지를 다시 불러오십시오.
이전 댓글 표시
0 개 추천
cg00008493 0.987979722052904 "COX8C;KIAA1409" 14 93813777 0.986128428295584 "COX8C;KIAA1409" 14 93813777
cg00031162 0.378288688845672 "TNFSF12;TNFSF12-TNFSF13" 17 7453377 0.362510745266914 "TNFSF12;TNFSF12-TNFSF13" 17 7453377
here are 2 lines and each line have 8 columns, i want to split each line have 2 sets like "COX8C;KIAA1409" into 2 rows and delete the duplicated columns output should be like this:
cg00008493 0.987979722052904 COX8C 0.986128428295584
cg00008493 0.987979722052904 KIAA1409 0.986128428295584
cg00031162 0.378288688845672 "TNFSF12 0.362510745266914
cg00031162 0.378288688845672 TNFSF12-TNFSF13 0.362510745266914
fid = fopen('COADREAD_methylation.txt','r');
data={};
while ~feof(fid)
l=fgetl(fid);
if isempty(strfind(l,'NA')), data=[data;{l}]; end
a = reshape(l, ',','""', [])';
end
fid=fclose(fid);
Note: I used NA to remove the lines which have NA
채택된 답변
0 개 추천
opt = {'CollectOutput',true};
inp = '%s%s%q%*d%*d%s%*q%*d%*d';
out = '%s\t%s\t%s\t%s\n';
f1d = fopen('temp1.txt','rt'); % the original file
f2d = fopen('temp2.txt','wt'); % the new file
while ~feof(f1d)
C = textscan(f1d,inp,1,opt{:});
C = [C{:}];
D = regexp(C{3},';','split');
for k = 1:numel(D)
fprintf(f2d,out,C{1:2},D{k},C{4});
end
end
fclose(f1d);
fclose(f2d);
Produces this output file:
cg00008493 0.987979722052904 COX8C 0.986128428295584
cg00008493 0.987979722052904 KIAA1409 0.986128428295584
cg00031162 0.378288688845672 TNFSF12 0.362510745266914
cg00031162 0.378288688845672 TNFSF12-TNFSF13 0.362510745266914
Tested on this input file:
댓글 수: 18
chocho
2017년 2월 16일
hi friend , i have multiple columns around 547 ,not only those which i mentioned as in the example, so how could i update this input inp = '%s%s%q%*d%*d%s%*q%*d%*d';???
chocho
2017년 2월 17일
thanks a lot, i will take your remarks into consideration! Great Job..
chocho
2017년 2월 17일
Sorry for the low efficiency but i got this error in fprintf Error using fprintf Invalid file identifier. Use fopen to generate a valid file identifier.
Error in splitremove (line 11) fprintf(f2d,out,C{1:2},D{k},C{4});
Stephen23
2017년 2월 17일
@chocho phD: you need to provide the correct filepath to fopen.
chocho
2017년 2월 17일
i already opened so many files as i put all of them in one file to matlab path
It is not clear what "i already opened so many files as i put all of them in one file to matlab path" means. Can you please explain that clearly.
chocho
2017년 2월 18일
i mean why in the command window is showing me this error of "Use fopen to generate a valid file identifier". as i see in your code everything is so clear but it doesn't work see the second error in line 11 "fprintf(fid2,out,C{1:2},D{k},C{4});" plz tell me what i should do C:\Program Files (x86)\MATLAB\R2012a this is the file path in which i'm working on..
Image Analyst
2017년 2월 18일
He used f1d (eff one dee) and f2d (eff two dee), not fid2 (eff eye dee two).
yes i see, so!!
chocho
2017년 2월 18일
hi friend any updates!!
@chocho phD: do not work in that directory.
That is the installation directory of MATLAB. It is not intended for your to use any installation directory for working in. NEVER use any of the Program Files folders for your MATLAB current directory.
You should be using a subdirectory of your user directory, e.g.:
C:\Users\<your user name>\Documents\MATLAB\Working
Walter Roberson
2017년 2월 18일
"C:\Program Files (x86)\MATLAB\R2012a this is the file path in which i'm working on"
You cannot write to any directory under "C:\Program Files (x86)" because MS Windows will not allow that. You need to cd to a different directory and work there.
chocho
2017년 2월 18일
got it ! thank you too much
chocho
2017년 2월 22일
Stephen Cobeldick your code work very good but could you change it by using loop i tried but i fail. error:Index exceeds matrix dimensions. Error in splitremove (line 13) D = regexp(C{3},';','split');
chocho
2017년 2월 22일
inp = '%s %f1%s%d%d %f2%s%d%d %f3%s%d%d ........... ;
Stephen23
2017년 2월 22일
If textscan has an empty output then you probably need to check the format string.
chocho
2017년 2월 22일
could you tell me how to present the format of this line? cg00000292 0.511852232819811 ATP2A1 0.787687855895422 0.51208122605745 0.599610258157912 0.568034757766559
추가 답변 (0개)
카테고리
도움말 센터 및 File Exchange에서 File Operations에 대해 자세히 알아보기
태그
아직 태그를 입력하지 않았습니다.
참고 항목
웹사이트 선택
번역된 콘텐츠를 보고 지역별 이벤트와 혜택을 살펴보려면 웹사이트를 선택하십시오. 현재 계신 지역에 따라 다음 웹사이트를 권장합니다:
또한 다음 목록에서 웹사이트를 선택하실 수도 있습니다.
사이트 성능 최적화 방법
최고의 사이트 성능을 위해 중국 사이트(중국어 또는 영어)를 선택하십시오. 현재 계신 지역에서는 다른 국가의 MathWorks 사이트 방문이 최적화되지 않았습니다.
미주
- América Latina (Español)
- Canada (English)
- United States (English)
유럽
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)
