Tag: ACCUMARRAY
Utilizo ray y torch en mi código y configuro un núcleo de CPU para cada actor remoto de ray para computar el gradiente (usando el paquete torch). Pero encuentro que la utilización de CPU del actor puede llegar a ser de hasta 300% en algunas ocasiones. Esto parece ser imposible . . . Read more
Estoy utilizando Ray RLlib para entrenar un agente PPO con DOS modificaciones en el PPOTFPolicy. Añadí una clase mixin (llamada “Recal”) al parámetro “mixins” en “build_tf_policy()”. De esta manera, el PPOTFPolicy heredaría de mi clase “Recal” y tendría acceso a las funciones miembro que definí en “Recal”. Mi clase “Recal” . . . Read more
Digamos que tengo clases donde defino atributos como getter/setter. Las clases son como esta: class TestClass: def __init__(self): self.name = “nombre predeterminado” @property def myname(self): self._myname = self.name return self._myname @myname.setter def myname(self, n): self._myname = n self.name = self._myname Instancio estas clases. En este ejemplo, instancio varias veces la . . . Read more
Tengo un clúster de Ray desplegado en un clúster de AKS. Actualmente solo tengo 1 nodo de trabajador. La versión de Ray que estoy utilizando es la 1.9.0. La cápsula llamada linear-model-5cd66b57d8-rn6ft contiene el código para ejecutar el entrenamiento de un modelo de Pytorch. Obtuve el código de la documentación . . . Read more
He desplegado un clúster Ray en un clúster AKS. Para ejecutar mis aplicaciones aprovechando el clúster Ray, actualmente despliego cada una de mis aplicaciones como un objeto Deployment clásico de k8s y me conecto al clúster Ray usando ray.init(address=”<head-node-ip:10001>”) El problema es que inserto manualmente la IP del nodo principal . . . Read more