/ - Diff - D-Net - D-Net project tracking tool

     <!-- Note that documentation placed in comments in this file uses the
     "markdown" syntax (along with its way of dividing text into sections). -->
     <workflow-app xmlns="uri:oozie:workflow:0.3" name="test-core_examples_hadoopstreaming_cloner_with_unicode_escape_codes">
     	<start to="data_producer" />
     	<start to="generate-schema" />
     	<action name="generate-schema">
     	    <java>
         		<job-tracker>${jobTracker}</job-tracker>
             	<name-node>${nameNode}</name-node>
     	        <main-class>eu.dnetlib.iis.core.javamapreduce.hack.AvroSchemaGenerator</main-class>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.documenttext.DocumentText</arg>
     	        <capture-output />
     	    </java>
     	    <ok to="data_producer" />
     	    <error to="fail" />
     	</action>
     	<action name="data_producer">
     		<java>
     			<job-tracker>${jobTracker}</job-tracker>
-...
                         <value>${workingDir}/data_producer/document_text</value>
                     </property>
                     <property>
                         <name>eu.dnetlib.iis.avro.input.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documenttext.DocumentText</value>
                     </property>
     				<property>
     				    <name>input.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documenttext.DocumentText']}</value>
     				</property>
     				<!-- OUTPUT -->
                     <property>
-...
                         <value>${workingDir}/python_cloner/document_text</value>
                     </property>
                     <property>
                         <name>eu.dnetlib.iis.avro.output.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documenttext.DocumentText</value>
                     </property>
     				<property>
     				    <name>output.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documenttext.DocumentText']}</value>
     				</property>
                 </configuration>
             </map-reduce>

     <!-- Note that documentation placed in comments in this file uses the
     "markdown" syntax (along with its way of dividing text into sections). -->
     <workflow-app xmlns="uri:oozie:workflow:0.3" name="test-core_examples_hadoopstreaming_cloner">
     	<start to="producer" />
     	<start to="generate-schema" />
     	<action name="generate-schema">
     	    <java>
         		<job-tracker>${jobTracker}</job-tracker>
             	<name-node>${nameNode}</name-node>
     	        <main-class>eu.dnetlib.iis.core.javamapreduce.hack.AvroSchemaGenerator</main-class>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</arg>
     	        <capture-output />
     	    </java>
     	    <ok to="producer" />
     	    <error to="fail" />
     	</action>
     	<action name="producer">
     		<java>
     			<job-tracker>${jobTracker}</job-tracker>
-...
                         <name>mapred.input.dir</name>
                         <value>${workingDir}/producer/person</value>
                     </property>
                     <!-- Name of the input schema. -->
                     <property>
                         <name>eu.dnetlib.iis.avro.input.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</value>
                     </property>
     				    <name>input.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person']}</value>
     				</property>
                     <property>
                         <name>mapred.output.dir</name>
                         <value>${workingDir}/cloner/person</value>
                     </property>
                     <!-- Name of the output schema. -->
                     <property>
                         <name>eu.dnetlib.iis.avro.output.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</value>
                     </property>
     				<property>
     				    <name>output.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person']}</value>
     				</property>
                 </configuration>
             </map-reduce>
             <ok to="consumer"/>

     <!-- Note that documentation placed in comments in this file uses the
     "markdown" syntax (along with its way of dividing text into sections). -->
     <workflow-app xmlns="uri:oozie:workflow:0.3" name="test-core_examples_hadoopstreaming_wordcount">
     	<start to="producer" />
     	<start to="generate-schema" />
     	<action name="generate-schema">
     	    <java>
         		<job-tracker>${jobTracker}</job-tracker>
             	<name-node>${nameNode}</name-node>
     	        <main-class>eu.dnetlib.iis.core.javamapreduce.hack.AvroSchemaGenerator</main-class>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Document</arg>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.WordCount</arg>
     	        <capture-output />
     	    </java>
     	    <ok to="producer" />
     	    <error to="fail" />
     	</action>
     	<action name="producer">
     		<java>
     			<job-tracker>${jobTracker}</job-tracker>
-...
                         <name>mapred.input.dir</name>
                         <value>${workingDir}/producer/document</value>
                     </property>
                     <!-- Name of the input schema. -->
                     <property>
                         <name>eu.dnetlib.iis.avro.input.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Document</value>
                     </property>
     				    <name>input.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Document']}</value>
     				</property>
                     <property>
                         <name>mapred.output.dir</name>
                         <value>${workingDir}/title_wordcount/wordcount</value>
                     </property>
                     <!-- Name of the output schema. -->
                     <property>
                         <name>eu.dnetlib.iis.avro.output.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.WordCount</value>
                     </property>
     				<property>
     				    <name>output.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.WordCount']}</value>
     				</property>
                 </configuration>
             </map-reduce>
             <ok to="consumer"/>

     <!-- Note that documentation placed in comments in this file uses the
     "markdown" syntax (along with its way of dividing text into sections). -->
     <workflow-app xmlns="uri:oozie:workflow:0.3" name="test-core_examples_hadoopstreaming_wordcount_with_distributed_cache">
     	<start to="document_producer" />
     	<start to="generate-schema" />
     	<action name="generate-schema">
     	    <java>
         		<job-tracker>${jobTracker}</job-tracker>
             	<name-node>${nameNode}</name-node>
     	        <main-class>eu.dnetlib.iis.core.javamapreduce.hack.AvroSchemaGenerator</main-class>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Document</arg>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.WordCount</arg>
     	        <capture-output />
     	    </java>
     	    <ok to="document_producer" />
     	    <error to="fail" />
     	</action>
     	<action name="document_producer">
     		<java>
     			<job-tracker>${jobTracker}</job-tracker>
-...
                         <name>mapred.input.dir</name>
                         <value>${workingDir}/document_producer/document</value>
                     </property>
                     <!-- Name of the input schema. -->
     				<property>
     				    <name>input.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Document']}</value>
     				</property>
                     <property>
                         <name>eu.dnetlib.iis.avro.input.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Document</value>
                     </property>
                     <property>
                         <name>mapred.output.dir</name>
                         <value>${workingDir}/title_wordcount/wordcount</value>
                     </property>
                     <!-- Name of the output schema. -->
                     <property>
                         <name>eu.dnetlib.iis.avro.output.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.WordCount</value>
                     </property>
     				    <name>output.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.WordCount']}</value>
     				</property>
                 </configuration>
                 <!--
                 Files listed in <file> tags are copied from HDFS to DistibutedCache

     <workflow-app xmlns="uri:oozie:workflow:0.3" name="my_subworkflow">
         <start to="python_cloner2"/>
         <start to="generate-schema" />
     	<action name="generate-schema">
     	    <java>
         		<job-tracker>${jobTracker}</job-tracker>
             	<name-node>${nameNode}</name-node>
     	        <main-class>eu.dnetlib.iis.core.javamapreduce.hack.AvroSchemaGenerator</main-class>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</arg>
     	        <capture-output />
     	    </java>
     	    <ok to="python_cloner2" />
     	    <error to="fail" />
     	</action>
         <action name="python_cloner2">
             <map-reduce>
                 <job-tracker>${jobTracker}</job-tracker>
-...
                         <name>mapred.input.dir</name>
                         <value>${input_person}</value>
                     </property>
                      <!-- Name of the input schema. -->
     				<property>
     				    <name>input.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person']}</value>
     				</property>
                     <property>
                         <name>eu.dnetlib.iis.avro.input.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</value>
                     </property>
                     <property>
                         <name>mapred.output.dir</name>
                         <value>${output_person}</value>
                     </property>
                     <!-- Name of the output schema. -->
                     <property>
                         <name>eu.dnetlib.iis.avro.output.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</value>
                     </property>
     				<property>
     				    <name>output.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person']}</value>
     				</property>
                 </configuration>
             </map-reduce>
             <ok to="end"/>

     <!-- Note that documentation placed in comments in this file uses the
     "markdown" syntax (along with its way of dividing text into sections). -->
     <workflow-app xmlns="uri:oozie:workflow:0.3" name="test-core_examples_hadoopstreaming_cloner_without_reducer_with_subworkflow">
     	<start to="data_producer" />
     	<start to="generate-schema" />
     	<action name="generate-schema">
     	    <java>
         		<job-tracker>${jobTracker}</job-tracker>
             	<name-node>${nameNode}</name-node>
     	        <main-class>eu.dnetlib.iis.core.javamapreduce.hack.AvroSchemaGenerator</main-class>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</arg>
     	        <capture-output />
     	    </java>
     	    <ok to="data_producer" />
     	    <error to="fail" />
     	</action>
     	<action name="data_producer">
     		<java>
     			<job-tracker>${jobTracker}</job-tracker>
-...
                         <name>mapred.input.dir</name>
                         <value>${workingDir}/data_producer/person</value>
                     </property>
                     <!-- Name of the input schema. -->
     				<property>
     				    <name>input.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person']}</value>
     				</property>
                     <property>
                         <name>eu.dnetlib.iis.avro.input.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</value>
                     </property>
                     <property>
                         <name>mapred.output.dir</name>
                         <value>${workingDir}/python_cloner/output</value>
                     </property>
                     <!-- Name of the output schema. -->
                     <property>
                         <name>eu.dnetlib.iis.avro.output.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</value>
                     </property>
     				<property>
     				    <name>output.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person']}</value>
     				</property>
                 </configuration>
             </map-reduce>
             <ok to="my_subworkflow"/>

     <!-- Note that documentation placed in comments in this file uses the
     "markdown" syntax (along with its way of dividing text into sections). -->
     <workflow-app xmlns="uri:oozie:workflow:0.3" name="test-core_examples_hadoopstreaming_cloner_without_reducer">
     	<start to="data_producer" />
     	<start to="generate-schema" />
     	<action name="generate-schema">
     	    <java>
         		<job-tracker>${jobTracker}</job-tracker>
             	<name-node>${nameNode}</name-node>
     	        <main-class>eu.dnetlib.iis.core.javamapreduce.hack.AvroSchemaGenerator</main-class>
     	        <arg>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</arg>
     	        <capture-output />
     	    </java>
     	    <ok to="data_producer" />
     	    <error to="fail" />
     	</action>
     	<action name="data_producer">
     		<java>
     			<job-tracker>${jobTracker}</job-tracker>
-...
                         <name>mapred.input.dir</name>
                         <value>${workingDir}/data_producer/person</value>
                     </property>
                     <!-- Name of the input schema. -->
     				<property>
     				    <name>input.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person']}</value>
     				</property>
                     <property>
                         <name>eu.dnetlib.iis.avro.input.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</value>
                     </property>
                     <property>
                         <name>mapred.output.dir</name>
                         <value>${workingDir}/python_cloner/output</value>
                     </property>
                     <!-- Name of the output schema. -->
                     <property>
                         <name>eu.dnetlib.iis.avro.output.class</name>
                         <value>eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person</value>
                     </property>
     				<property>
     				    <name>output.schema.literal</name>
     				    <value>${wf:actionData('generate-schema')['eu.dnetlib.iis.core.examples.schemas.documentandauthor.Person']}</value>
     				</property>
                 </configuration>
             </map-reduce>
             <ok to="consumer"/>

Project

General

Profile

D-Net

Revision 36309

Added by Marek Horst over 9 years ago