added downsampler

2020-02-10 14:50:10 +01:00 · 2020-02-10 14:50:10 +01:00 · d6f021fc12
parent 1409eb5fca
commit d6f021fc12
2 changed files with 269 additions and 6 deletions
--- a/python/ucf/ucf.py
+++ b/python/ucf/ucf.py
@ -11,14 +11,21 @@ def __warning_format(message, category, filename, lineno, file=None, line=None):
        return '%s:%s: %s:%s\n' % (filename, lineno, category.__name__, message)
 warnings.formatwarning = __warning_format
 #############################
 # Low-level class interface #
 #############################
 class UCF:
    """UCF low-level access class"""
-    def __init__(self):
+    def __init__(self,file=None,verbosity=False,debug=False):
        self.__initializeConstants()
        self.__resetPublicProperties()
        self.__resetPrivateProperties()
        self.__resetCurrentStep()
        self.__resetCurrentSet()
        if file is not None:
            self.open(file)
        self.Debug = debug
        self.Verbosity = verbosity
    def open(self,file):
        """Opens an input stream for reading access. The variable 'file' can be of the following types:
@ -31,7 +38,7 @@ class UCF:
            self.File = file
            self.__external = False
            self.__stream   = False
-            self.__fileID   = open(self.File,self.IOMode)
+            self.__fileID   = open(self.File,'rb')
            self.__inputAvailable = True
        elif isinstance(file,tarfile.ExFileObject):
            self.File = file.name
@ -86,10 +93,11 @@ class UCF:
    def close(self):
        """Closes input file object"""
-        self.__fileID.close()
+        if not isinstance(self.__fileID,tarfile.ExFileObject):
            self.__fileID.close()
        self.__init__
-    def initBuffer(self,rank=0,rankijk=(0,0,0),ftype=1999):
+    def addFileHeaderToBuffer(self,rank=0,rankijk=(0,0,0),ftype=1999):
        """Initialize a buffer to generate a new UCF file."""
        self.__bufNumSteps  = 0
        self.__bufStep      = []
@ -135,6 +143,11 @@ class UCF:
        self.__bufParams[step-1][dset-1] = params
        self.__bufData[step-1][dset-1] = data
    def copyFileHeaderToBuffer(self):
        if not self.__inputAvailable:
            raise IOError('No input file available')
        self.addFileHeaderToBuffer(rank=self.IORank[0],rankijk=self.IORank[1:],ftype=self.__typeID)
    def copyStepToBuffer(self,step_in,step_out=1,recursive=False,singlePrecision=False):
        """Copy a step from an input file to output buffer. If recursive copying is activated, all datasets
           within the step will be copied, otherwise only the step header is copied without datasets.
@ -318,9 +331,9 @@ class UCF:
            2: "particle",
            3: "statistics"
            }
-        self.Class = classDict.get(np.floor(self.__typeID/self.__factorTypeIDClass),"unknown");
+        self.Class = classDict.get(np.floor(self.__typeID/self.__factorTypeIDClass),"unknown")
        # Parse IO rank
-        self.IORank = header[5:8];
+        self.IORank = header[4:8]
    def __readHeaderStep(self):
        # Read and parse
@ -462,3 +475,72 @@ class UCF:
        self.__currentSetNumParams       = 0
        self.__currentSetParams          = 0
        self.__currentSetNumElements     = 0
 #################################
 # High-level function interface #
 #################################
 def readGrid(file,verbosity=False,debug=False):
    obj = UCF(file=file,verbosity=verbosity,debug=debug)
    output = []
    for iset in range(0,obj.NumDataset):
        (data,params) = obj.readSet(step=1,dset=iset)
        nx = params[0]
        ny = params[1]
        nz = params[2]
        output.append(data[0:nx])
        output.append(data[nx:nx+ny])
        output.append(data[nx+ny:nx+ny+nz])
    obj.close()
    if obj.UCFVersion<2:
        output.extend(output[-3:])
    return output
 def readProcgrid(file,verbosity=False,debug=False):
    obj = UCF(file=file,verbosity=verbosity,debug=debug)
    output = []
    for iset in range(0,obj.NumDataset):
        (data,params) = obj.readSet(step=1,dset=iset)
        nxp = params[0]
        nyp = params[1]
        nzp = params[2]
        output.append(data[0:nxp])                             # ibeg
        output.append(data[nxp:2*nxp])                         # iend
        output.append(data[2*nxp:2*nxp+nyp])                   # jbeg
        output.append(data[2*nxp+nyp:2*nxp+2*nyp])             # jend
        output.append(data[2*nxp+2*nyp:2*nxp+2*nyp+nzp])       # kbeg
        output.append(data[2*nxp+2*nyp+nzp:2*nxp+2*nyp*2*nzp]) # kend
    obj.close()
    if obj.UCFVersion<2:
        output.extend(output[-6:])
    return output
 def readFieldChunk(file,step=1,dset=-1,verbosity=False,debug=False):
    obj = UCF(file=file,verbosity=verbosity,debug=debug)
    if not isinstance(dset,list):
        if dset==-1:
            dset = range(1,obj.NumDataset+1) # fix that maybe later (this is maximum over all timesteps)
        else:
            dset = [dset]
    output = []
    for ii in dset:
        tmp = dict()
        (data,params) = obj.readSet(step=step,dset=ii)
        tmp['ighost'] = params[0]
        tmp['ibeg']   = params[1]
        tmp['jbeg']   = params[2]
        tmp['kbeg']   = params[3]
        tmp['nxl']    = params[4]
        tmp['nyl']    = params[5]
        tmp['nzl']    = params[6]
        tmp['nx']     = params[7]
        tmp['ny']     = params[8]
        tmp['nz']     = params[9]
        tmp['data']   = data.reshape((tmp['nxl']+2*tmp['ighost'],
                                      tmp['nyl']+2*tmp['ighost'],
                                      tmp['nzl']+2*tmp['ighost']),
                                     order='F')
        tmp['rank']   = obj.IORank[0]
        tmp['rankijk']= obj.IORank[1:]
        output.append(tmp)
    obj.close()
    return output
--- a/python/ucftar_downsampler
+++ b/python/ucftar_downsampler
@ -0,0 +1,181 @@
 #!/usr/bin/env python3
 import sys
 import io
 import tarfile
 import argparse
 import numpy as np
 import ucf
 parser = argparse.ArgumentParser(description='Reads an ucf.tar archive, downsamples it and saves it to a new ucf.tar archive. Can be used as a pipe.')
 parser.add_argument("-i", "--infile", metavar='file',nargs='?', default=None, help="name of the input file [default: stdin]", action="store")
 parser.add_argument("-o", "--outfile", metavar='file',nargs='?', default=None, help="name of the output file [default: stdout]", action="store")
 parser.add_argument("-n", "--nskip", metavar='N',nargs='?', type=int, default=2, help="keep every Nth grid point [default: 2]", action="store")
 parser.add_argument("-sp", "--single-precision", help="output data in single-precision? [default: False]", action="store_true")
 args = parser.parse_args()
 nskip    = args.nskip
 file_in  = args.infile
 file_out = args.outfile
 saveSinglePrecision = args.single_precision
 if file_in is None:
  istream = tarfile.open(fileobj=sys.stdin.buffer,mode='r|',bufsize=512*1024**2,ignore_zeros=True)
 else:
  filehandle_in = open(file_in,'rb')
  istream = tarfile.open(fileobj=filehandle_in,mode='r')
 if file_out is None:
  ostream = tarfile.open(fileobj=sys.stdout.buffer,mode='w|',bufsize=512*1024**2,pax_headers=tarfile.USTAR_FORMAT)
 else:
  filehandle_out = open(file_out,'wb')
  ostream = tarfile.open(fileobj=filehandle_out,mode='w',pax_headers=tarfile.USTAR_FORMAT)
 while True:
    iinfo = istream.next()
    if iinfo is None:
        break
    print(iinfo.name,file=sys.stderr)
    ucfbytes_in = istream.extractfile(iinfo).read()
    ucfbytes_out = b''
    if iinfo.name=='parameters.asc':
      ucfbytes_out += ucfbytes_in
    if iinfo.name=='particles.bin':
      ucfbytes_out += ucfbytes_in
    if iinfo.name=='grid.bin':
      ucfhandle = ucf.UCF(file=ucfbytes_in,verbosity=False)
      ucfhandle.copyFileHeaderToBuffer()
      ucfhandle.copyStepToBuffer(1,step_out=1,recursive=False)
      for iset in range(0,ucfhandle.NumDataset):
        (data,params) = ucfhandle.readSet(step=1,dset=iset+1)
        params = list(params)
        nx = params[0]
        ny = params[1]
        nz = params[2]
        x = data[0:nx:nskip]
        y = data[nx:nx+ny:nskip]
        z = data[nx+ny:nx+ny+nz:nskip]
        params[0] = len(x)
        params[1] = len(y)
        params[2] = len(z)
        data = np.concatenate((x,y,z))
        ucfhandle.addDatasetToBuffer(data,params=params,step=1,dset=iset+1)
      ucfbytes_out += ucfhandle.flushBuffer()
      ucfhandle.close()
    if iinfo.name=='proc.bin':
      ucfhandle = ucf.UCF(file=ucfbytes_in,verbosity=False)
      ucfhandle.copyFileHeaderToBuffer()
      ucfhandle.copyStepToBuffer(1,step_out=1,recursive=False)
      for iset in range(0,ucfhandle.NumDataset):
        (data,params) = ucfhandle.readSet(step=1,dset=iset+1)
        nxp = params[0]
        nyp = params[1]
        nzp = params[2]
        ibeg = np.copy(data[0:nxp]                            )
        iend = np.copy(data[nxp:2*nxp]                        )
        jbeg = np.copy(data[2*nxp:2*nxp+nyp]                  )
        jend = np.copy(data[2*nxp+nyp:2*nxp+2*nyp]            )
        kbeg = np.copy(data[2*nxp+2*nyp:2*nxp+2*nyp+nzp]      )
        kend = np.copy(data[2*nxp+2*nyp+nzp:2*nxp+2*nyp*2*nzp])
        for ixp in range(0,nxp):
          ibeg[ixp] = (ibeg[ixp]-1)//nskip+1
          iend[ixp] = (iend[ixp]-1)//nskip+1
        for iyp in range(0,nyp):
          jbeg[iyp] = (jbeg[iyp]-1)//nskip+1
          jend[iyp] = (jend[iyp]-1)//nskip+1 
        for izp in range(0,nzp):
          kbeg[izp] = (kbeg[izp]-1)//nskip+1
          kend[izp] = (kend[izp]-1)//nskip+1
        data = np.concatenate((ibeg,iend,jbeg,jend,kbeg,kend))
        ucfhandle.addDatasetToBuffer(data,params=params,step=1,dset=iset+1)
      ucfbytes_out += ucfhandle.flushBuffer()
      ucfhandle.close()
    if 'uvwp.' in iinfo.name:
      ucfhandle = ucf.UCF(file=ucfbytes_in,verbosity=False)
      ucfhandle.copyFileHeaderToBuffer()
      ucfhandle.copyStepToBuffer(1,step_out=1,recursive=False)
      for iset in range(0,4):
        (data,params_in) = ucfhandle.readSet(step=1,dset=iset+1)
        ighost  = params_in[0]
        (ibeg,jbeg,kbeg) = params_in[1:4]
        (nxl,nyl,nzl)    = params_in[4:7]
        (nxg,nyg,nzg)    = params_in[7:10]
        data    = data.reshape((nxl+2*ighost,nyl+2*ighost,nzl+2*ighost),order='F')
        islice = [ii-ibeg+ighost for ii in range(ibeg,ibeg+nxl) if (ii-1)%nskip==0] 
        jslice = [ii-jbeg+ighost for ii in range(jbeg,jbeg+nyl) if (ii-1)%nskip==0] 
        kslice = [ii-kbeg+ighost for ii in range(kbeg,kbeg+nzl) if (ii-1)%nskip==0]
        data = data[np.ix_(islice,jslice,kslice)]
        ibeg = (islice[0]+ibeg-ighost)//nskip+1 
        jbeg = (jslice[0]+jbeg-ighost)//nskip+1 
        kbeg = (kslice[0]+kbeg-ighost)//nskip+1 
        (nxl,nyl,nzl) = data.shape
        nxg = (nxg-1)//nskip+1
        nyg = (nyg-1)//nskip+1
        nzg = (nzg-1)//nskip+1
        params_out = list(params_in)
        params_out[0]    = 0
        params_out[1:4]  = (ibeg,jbeg,kbeg)
        params_out[4:7]  = (nxl,nyl,nzl)
        params_out[7:10] = (nxg,nyg,nzg)
        if saveSinglePrecision:
          data = data.astype(np.float32,casting='same_kind')
        ucfhandle.addDatasetToBuffer(data,params=params_out,step=1,dset=iset+1)
      ucfbytes_out += ucfhandle.flushBuffer()
      ucfhandle.close()
    if 'scal.' in iinfo.name:
      ucfhandle = ucf.UCF(file=ucfbytes_in,verbosity=False)
      ucfhandle.copyFileHeaderToBuffer()
      ucfhandle.copyStepToBuffer(1,step_out=1,recursive=False)
      for iset in range(0,ucfhandle.NumDataset):
        (data,params_in) = ucfhandle.readSet(step=1,dset=iset+1)
        ighost  = params_in[0]
        (ibeg,jbeg,kbeg) = params_in[1:4]
        (nxl,nyl,nzl)    = params_in[4:7]
        (nxg,nyg,nzg)    = params_in[7:10]
        data    = data.reshape((nxl+2*ighost,nyl+2*ighost,nzl+2*ighost),order='F')
        islice = [ii-ibeg+ighost for ii in range(ibeg,ibeg+nxl) if (ii-1)%nskip==0] 
        jslice = [ii-jbeg+ighost for ii in range(jbeg,jbeg+nyl) if (ii-1)%nskip==0] 
        kslice = [ii-kbeg+ighost for ii in range(kbeg,kbeg+nzl) if (ii-1)%nskip==0]
        data = data[np.ix_(islice,jslice,kslice)]
        ibeg = (islice[0]+ibeg-ighost)//nskip+1 
        jbeg = (jslice[0]+jbeg-ighost)//nskip+1 
        kbeg = (kslice[0]+kbeg-ighost)//nskip+1 
        (nxl,nyl,nzl) = data.shape
        nxg = (nxg-1)//nskip+1
        nyg = (nyg-1)//nskip+1
        nzg = (nzg-1)//nskip+1
        params_out = list(params_in)
        params_out[0]    = 0
        params_out[1:4]  = (ibeg,jbeg,kbeg)
        params_out[4:7]  = (nxl,nyl,nzl)
        params_out[7:10] = (nxg,nyg,nzg)
        if saveSinglePrecision:
          data = data.astype(np.float32,casting='same_kind')
        ucfhandle.addDatasetToBuffer(data,params=params_out,step=1,dset=iset+1)
      ucfbytes_out += ucfhandle.flushBuffer()
      ucfhandle.close()
    oinfo = tarfile.TarInfo(name=iinfo.name)
    oinfo.size = len(ucfbytes_out)
    ostream.addfile(oinfo,fileobj=io.BytesIO(ucfbytes_out))
 istream.close()
 ostream.close()
 if file_in is not None:
  filehandle_in.close()
 if file_out is not None:
  filehandle_out.close()